MLCommons หน่วยงานกลางสำหรับการจัดอันดับประสิทธิภาพคอมพิวเตอร์ในงานด้าน machine learning ประกาศผล MLPerf Training 3.0 แสดงประสิทธิภาพของการฝึกโมเดลปัญญาประดิษฐ์รูปแบบต่างๆ มีผู้ส่งระบบเข้าร่วม 250 ระบบ จากผู้ผลิตหรือคลาวด์รวม 16 ราย ภาพรวมแล้วระบบต่างๆ เร็วขึ้นกว่าการทดสอบรอบก่อนหน้านี้ 1.54 เท่าตัว ความพิเศษของรอบนี้คือมีการทดสอบฝึก GPT-3 เข้ามาด้วย เพื่อดูประสิทธิภาพของการฝึก LLM และรอบนี้มีเฉพาะ NVIDIA และ Intel เท่านั้นที่ส่งผลเข้ามา
ผลทดสอบอันดับหนึ่งในหมวด LLM เป็นของ NVIDIA และ CoreWeave ที่ทดสอบด้วยระบบที่ใช้ Xeon Platinum 8462Y+ จำนวน 896 ตัว ร่วมกับ NVIDIA H100-SXM5-80GB อีก 3,584 ใบ ใช้ซอฟต์แวร์ NVIDIA NeMo Megatron Release 23.04 สามารถทำเวลาการฝึก GPT-3 ได้ในเวลา 10.9 นาทีเท่านั้น ทาง NVIDIA ระบุว่าผลทดสอบนี้จะสร้างมาตรฐาน และชิป NVIDIA ก็สามารถส่งผลทดสอบทุกชุดทดสอบได้หมด
ผู้ผลิตอีกรายที่ส่งผลทดสอบ LLM มาด้วยคือ Intel ที่ใช้ Xeon Platinum 8380 จำนวน 96 ตัวร่วมกับชิป Habana Gaudi2 จำนวน 384 ตัว ใช้เวลาฝึก GPT-3 รวม 311.9 นาที โดยอินเทลโชว์ว่าชิป Gaudi2 นั้นทำงานเป็นคลัสเตอร์ขนาดใหญ่ได้จริง ประสิทธิภาพต่อชิปแทบไม่ตกเลยแม้จะเพิ่มจาก 256 ชิปเป็น 384 ชิป ต้นทุนการฝึกปัญญาประดิษฐ์ก็ต่ำกว่ามากเมื่อเทียบกับคลัสเตอร์ของ NVIDIA
ที่มา - MLCommons, NVIDIA, Intel
Topics:
Artificial Intelligence
LLM
NVIDIA
Intel
อ่านต่อ...
ผลทดสอบอันดับหนึ่งในหมวด LLM เป็นของ NVIDIA และ CoreWeave ที่ทดสอบด้วยระบบที่ใช้ Xeon Platinum 8462Y+ จำนวน 896 ตัว ร่วมกับ NVIDIA H100-SXM5-80GB อีก 3,584 ใบ ใช้ซอฟต์แวร์ NVIDIA NeMo Megatron Release 23.04 สามารถทำเวลาการฝึก GPT-3 ได้ในเวลา 10.9 นาทีเท่านั้น ทาง NVIDIA ระบุว่าผลทดสอบนี้จะสร้างมาตรฐาน และชิป NVIDIA ก็สามารถส่งผลทดสอบทุกชุดทดสอบได้หมด
ผู้ผลิตอีกรายที่ส่งผลทดสอบ LLM มาด้วยคือ Intel ที่ใช้ Xeon Platinum 8380 จำนวน 96 ตัวร่วมกับชิป Habana Gaudi2 จำนวน 384 ตัว ใช้เวลาฝึก GPT-3 รวม 311.9 นาที โดยอินเทลโชว์ว่าชิป Gaudi2 นั้นทำงานเป็นคลัสเตอร์ขนาดใหญ่ได้จริง ประสิทธิภาพต่อชิปแทบไม่ตกเลยแม้จะเพิ่มจาก 256 ชิปเป็น 384 ชิป ต้นทุนการฝึกปัญญาประดิษฐ์ก็ต่ำกว่ามากเมื่อเทียบกับคลัสเตอร์ของ NVIDIA
ที่มา - MLCommons, NVIDIA, Intel
Topics:
Artificial Intelligence
LLM
NVIDIA
Intel
อ่านต่อ...