ข่าว Alibaba เผยแพร่ Qwen2.5-Max โมเดล AI MoE ขนาดใหญ่ ผลทดสอบคะแนนสูงกว่า DeepSeek V3

News · วันพุธ เวลา 19:40

Alibaba เผยแพร่โมเดลปัญญาประดิษฐ์ Qwen2.5-Max ซึ่งเป็นโมเดลภาษาขนาดใหญ่แบบ MoE (Mixture-of-Expert) เหมือนกับ DeepSeek V3 ถูก Pre-train มากกว่า 20 ล้านล้านโทเค็น และทำ Post-Train ด้วยวิธี SFT (Supervised Fine-Tuning) และ RLHF (Reinforcement Learning from Human Feedback)

ผลทดสอบความสามารถของ Qwen2.5-Max ได้คะแนนเหนือกว่า DeepSeek-V3, GPT-4o และ Claude-3.5-Sonnet ในหัวข้อเช่น Arena-Hard, LiveBench ส่วนหัวข้ออย่าง MMLU-Pro กับ LiveCodeBench คะแนนสูงกว่า DeepSeek-V3 แต่น้อยกว่า Claude-3.5-Sonnet

Qwen2.5-Max เปิดให้ใช้งานแล้ววันนี้ผ่าน API ของ Alibaba Cloud และผ่านบริการ Qwen Chat

ที่มา: Alibaba

Topics:
Alibaba Cloud
Artificial Intelligence
LLM

Continue reading...

ข่าว Alibaba เผยแพร่ Qwen2.5-Max โมเดล AI MoE ขนาดใหญ่ ผลทดสอบคะแนนสูงกว่า DeepSeek V3

News

Moderator