กูเกิลเปิดตัว DataGemma โมเดล LLM ที่ออกแบบมาเพื่อแก้ปัญหาหลอน (hallucination) ที่มักพบในโมเดล LLM จากการมั่นใจแล้วให้ข้อมูลที่ผิดพลาด ซึ่งกูเกิลแก้ปัญหานี้ด้วยการเชื่อมต่อกับฐานข้อมูลปัจจุบันในการอ้างอิง
แพลตฟอร์มที่กูเกิลใช้เรียกว่า Data Commons เป็น Knowledge Graph ที่มีชุดข้อมูลมากกว่า 240 พันล้านจุด ใช้แหล่งข้อมูลที่น่าเชื่อถือทั้งจาก United Nations (UN), World Health Organization (WHO), Centers for Disease Control and Prevention (CDC) และ Census Bureaus ทำให้ได้ผลลัพธ์เป็น AI ที่สามารถให้ข้อมูลที่ถูกต้อง
กูเกิลใช้สองวิธีการที่เพิ่มเติมใน Gemma ให้เชื่อมต่อข้อมูลกับ Data Commons วิธีแรกคือ RIG (Retrieval-Interleaved Generation) โดยโมเดลถูกกำหนดให้ต้องระบุสถิติอ้างอิงกับ Data Commons เสมอเมื่อให้คำตอบ และวิธี RAG (Retrieval-Augmented Generation) ให้โมเดลต้องเพิ่ม context กับ Data Commons เพื่อเสริมข้อมูลก่อนที่จะให้คำตอบ
ผลทดสอบการทำงานของ LLM ร่วมกับวิธี RIG และ RAG พบว่าโมเดลสามารถตอบคำถามที่ต้องการความแม่นยำถูกต้องของข้อมูลได้ดีขึ้นจากโมเดลปกติ 5-17%
ดูรายละเอียดเพิ่มเติมของ DataGemma ได้ที่ Hugging Face ซึ่งเปิดให้ใช้งานสำหรับภาคการศึกษาและการวิจัย
ที่มา: กูเกิล
Topics:
Google
LLM
Gemini
Continue reading...
แพลตฟอร์มที่กูเกิลใช้เรียกว่า Data Commons เป็น Knowledge Graph ที่มีชุดข้อมูลมากกว่า 240 พันล้านจุด ใช้แหล่งข้อมูลที่น่าเชื่อถือทั้งจาก United Nations (UN), World Health Organization (WHO), Centers for Disease Control and Prevention (CDC) และ Census Bureaus ทำให้ได้ผลลัพธ์เป็น AI ที่สามารถให้ข้อมูลที่ถูกต้อง
กูเกิลใช้สองวิธีการที่เพิ่มเติมใน Gemma ให้เชื่อมต่อข้อมูลกับ Data Commons วิธีแรกคือ RIG (Retrieval-Interleaved Generation) โดยโมเดลถูกกำหนดให้ต้องระบุสถิติอ้างอิงกับ Data Commons เสมอเมื่อให้คำตอบ และวิธี RAG (Retrieval-Augmented Generation) ให้โมเดลต้องเพิ่ม context กับ Data Commons เพื่อเสริมข้อมูลก่อนที่จะให้คำตอบ
ผลทดสอบการทำงานของ LLM ร่วมกับวิธี RIG และ RAG พบว่าโมเดลสามารถตอบคำถามที่ต้องการความแม่นยำถูกต้องของข้อมูลได้ดีขึ้นจากโมเดลปกติ 5-17%
ดูรายละเอียดเพิ่มเติมของ DataGemma ได้ที่ Hugging Face ซึ่งเปิดให้ใช้งานสำหรับภาคการศึกษาและการวิจัย
ที่มา: กูเกิล
Topics:
LLM
Gemini
Continue reading...