กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


ข่าว กูเกิลปล่อย PaliGemma 2 โมเดลปัญญาประดิษฐ์โอเอรับภาพแบบโอเพนซอร์ส อ่านสูตรเคมี, โน้ตเพลง, ภาพเอ็กเรย์

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อNews 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Moderator
สมาชิกทีมงาน
Moderator
Verify member
กูเกิลปล่อยโมเดล PaliGemma 2 โมเดลปัญญาประดิษฐ์ LLM แบบ multimodal โอเพนที่ปรับปรุงจากเวอร์ชั่นแรกที่ปล่อยมาในงาน Google I/O ปีนี้ โดยโมเดลมีหลายขนาดให้เลือก, อธิบายภาพได้ละเอียดขึ้น, และขยายความสามารถใหม่ๆ เพิ่มเติม

โมเดลมี 3 ขนาด คือ 3B, 10B, และ 28B โดยรองรับภาพ 3 ขนาดเช่นกัน คือ 224x224, 448x448, และ 896x896 รวมโมเดลทั้งหมด 9 รุ่น มีความสามารถหลากหลาย ตั้งแต่การบรรยายภาพพื้นฐาน เรื่อยไปจนถึงการอ่านเอกสารเฉพาะด้าน เช่นเอกสารตารางทางการเงินที่ทำได้ดีขึ้นกว่าเวอร์ชั่นเดิม, อ่านโน้ตเพลง, หรือแม้แต่ภาพเอ็กเรย์ปอด

แนวทางการใช้งาน PaliGemma เช่น การอ่านเอกสาร, ตรวจจับวัตถุ (object detection), หรืองานอื่นๆ ที่ผสมกันระหว่างการใช้ทั้งข้อความและภาพ

โมเดลเปิดให้ใช้งานฟรีภายใต้เงื่อนไขการใช้งาน Gemma ตัวโมเดลรองรับทั้ง HuggingFace Transformer, Keras, PyTorch, JAX, และ Gemma.cpp

ที่มา - Google Developers Blog

No Description


Topics:
Google
LLM

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง