กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


ข่าว Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อNews 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Moderator
สมาชิกทีมงาน
Moderator
Verify member
แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

ที่น่าสนใจคือ Ferret เผยแพร่ในรูปแบบโอเพนซอร์ส non-commercial สามารถนำไปวิจัยพัฒนาต่อได้แบบไม่แสวงหาผลประโยชน์ ซึ่งนักวิจัยด้าน AI มองว่าเป็นก้าวที่ดีของแอปเปิล ที่ปกติไม่ค่อยโอเพนซอร์สงานวิจัยที่มีโอกาสพัฒนาเป็นผลิตภัณฑ์ได้แบบนี้

ที่มา: VentureBeat

No Description


🚀🚀Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity. 📰https://t.co/gED9Vu0I4y1⃣ Ferret enables referring of an image region at any shape2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc

— Zhe Gan (@zhegan4) October 12, 2023
Topics:
Apple
Artificial Intelligence
LLM
Open Source

อ่านต่อ...
 

ไฟล์แนบ

  • a553f2ecc03947661c35ed5e9df034cf.png
    a553f2ecc03947661c35ed5e9df034cf.png
    1.4 MB · จำนวนการดู: 23

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง