ข่าว Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

News · 25 ธ.ค. 2023

แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

ที่น่าสนใจคือ Ferret เผยแพร่ในรูปแบบโอเพนซอร์ส non-commercial สามารถนำไปวิจัยพัฒนาต่อได้แบบไม่แสวงหาผลประโยชน์ ซึ่งนักวิจัยด้าน AI มองว่าเป็นก้าวที่ดีของแอปเปิล ที่ปกติไม่ค่อยโอเพนซอร์สงานวิจัยที่มีโอกาสพัฒนาเป็นผลิตภัณฑ์ได้แบบนี้

ที่มา: VentureBeat

Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity. https://t.co/gED9Vu0I4y1⃣ Ferret enables referring of an image region at any shape2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc

— Zhe Gan (@zhegan4) October 12, 2023

Topics:
Apple
Artificial Intelligence
LLM
Open Source

อ่านต่อ...

ข่าว Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

News

Moderator

ไฟล์แนบ