บริษัท MosaicML ที่เพิ่งถูกซื้อกิจการโดย Databricks เปิดเผยการใช้ชิปเร่งประมวลผล AI สองค่ายเปรียบเทียบกัน ได้แก่ NVIDIA A100 และ AMD MI250 (ทั้งสองรุ่นยังไม่ใช่ตัวใหม่ล่าสุด) พบว่าตอนนี้ชิปของ AMD สามารถทำประสิทธิภาพได้ราว 80% ของชิป NVIDIA แล้ว
ที่ผ่านมา ชิปฝั่ง AMD ตามหลัง NVIDIA อยู่มาก แต่ช่วงหลังเมื่อ AMD ลงทุนพัฒนาซอฟต์แวร์ให้คุณภาพดีขึ้น บวกกับ PyTorch 2.0 รองรับชิป AMD ดีกว่าเดิมมาก สามารถเทรนหรือรันโมเดลได้โดยไม่ต้องแก้โค้ด ทำให้ประสิทธิภาพตีตื้นขึ้นมาได้ โดย Hanlin Tang ซีทีโอของ MosaicML เชื่อว่าหาก AMD พัฒนาซอฟต์แวร์เพิ่มขึ้นขึ้น ประสิทธิภาพของชิปทั้งสองค่ายจะอยู่ในระดับเดียวกันได้แล้ว
ตามสเปกแล้ว ชิป MI250 ให้หน่วยความจำเยอะกว่าคือ 128GB ต่อการ์ดหนึ่งตัว ในขณะที่ A100 มีแยกเป็นรุ่น 40GB และ 80GB, ตัวสมรรถนะ TFLOPS ของฝั่ง AMD ก็สูงกว่าเป็นทุนเดิมอยู่แล้ว เหลือเพียงปรับปรุงซอฟต์แวร์พวก ROCm, RCCL ให้มีประสิทธิภาพดีขึ้นเท่านั้น
การทดสอบนี้ถือเป็นข่าวดีของวงการ AI เพราะสามารถเลือกใช้จีพียู AMD มาทดแทนจีพียู NVIDIA ที่ราคาอาจแพงหรือสินค้าขาดตลาดได้ โดยไม่ต้องแก้โค้ดใดๆ เลยหากเป็นโมเดลที่รันบน PyTorch
ที่มา - MosaicML, Reuters
Topics:
AMD
Instinct
Artificial Intelligence
Processor
NVIDIA
Server
PyTorch
อ่านต่อ...
ที่ผ่านมา ชิปฝั่ง AMD ตามหลัง NVIDIA อยู่มาก แต่ช่วงหลังเมื่อ AMD ลงทุนพัฒนาซอฟต์แวร์ให้คุณภาพดีขึ้น บวกกับ PyTorch 2.0 รองรับชิป AMD ดีกว่าเดิมมาก สามารถเทรนหรือรันโมเดลได้โดยไม่ต้องแก้โค้ด ทำให้ประสิทธิภาพตีตื้นขึ้นมาได้ โดย Hanlin Tang ซีทีโอของ MosaicML เชื่อว่าหาก AMD พัฒนาซอฟต์แวร์เพิ่มขึ้นขึ้น ประสิทธิภาพของชิปทั้งสองค่ายจะอยู่ในระดับเดียวกันได้แล้ว
ตามสเปกแล้ว ชิป MI250 ให้หน่วยความจำเยอะกว่าคือ 128GB ต่อการ์ดหนึ่งตัว ในขณะที่ A100 มีแยกเป็นรุ่น 40GB และ 80GB, ตัวสมรรถนะ TFLOPS ของฝั่ง AMD ก็สูงกว่าเป็นทุนเดิมอยู่แล้ว เหลือเพียงปรับปรุงซอฟต์แวร์พวก ROCm, RCCL ให้มีประสิทธิภาพดีขึ้นเท่านั้น
การทดสอบนี้ถือเป็นข่าวดีของวงการ AI เพราะสามารถเลือกใช้จีพียู AMD มาทดแทนจีพียู NVIDIA ที่ราคาอาจแพงหรือสินค้าขาดตลาดได้ โดยไม่ต้องแก้โค้ดใดๆ เลยหากเป็นโมเดลที่รันบน PyTorch
ที่มา - MosaicML, Reuters
Topics:
AMD
Instinct
Artificial Intelligence
Processor
NVIDIA
Server
PyTorch
อ่านต่อ...