ข่าว Stability.AI โชว์ผลทดสอบ Stable Diffusion 3 ชนะทุกตัวในท้องตลาด

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อNews 
  • วันที่เริ่มต้น วันที่เริ่มต้น
กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News 

Moderator
สมาชิกทีมงาน
Moderator
Verify member
Stability.AI รายงานผลทดสอบ Stable Diffusion 3 (SD3) ปัญญาประดิษฐ์วาดภาพที่เปิดตัวไปก่อนหน้านี้ โดยรอบนี้เปิดเผยสถาปัตยกรรมภายในเพิ่มเติมพร้อมกับรายงานผลทดสอบเทียบกับโมเดลอื่นๆ ในท้องตลาด

ผลทดสอบโดยอาศัยมนุษย์เป็นกรรมการตัดสินในสามหัวข้อ ได้แก่ ความสวยงาม, การทำตามคำสั่ง, และตัวอักษรในภาพ พบว่า SD3 ชนะโมเดลอื่นๆ แทบทั้งหมด ยกเว้นกรณีเดียวคือการเทียบความสวยงามกับโมเดล Ideogram 1.0

สถาปัตยกรรมหลักของ SD3 คือ Diffusion Transformer (DiT) ที่ปรับปรุงเป็นแบบ multimodal แยกส่วนระหว่างข้อความและภาพออกจากกันแต่ใช้ส่วน attention ร่วมกันเรียกว่า modified multimodal diffusion transformer (MMDiT) สถาปัตยกรรมนี้ทำให้ตัวโมเดลอ่านข้อความในภาพได้ และภาพสุดท้ายมีข้อความตามคำสั่ง ทาง Stability.AI ยังระบุว่าสามารถพัฒนาให้รองรับการสร้างวิดีโอได้ในอนาคต

SD3 มี text-encoder ภายใน 3 ตัว ได้แก่ CLIP-G/14, CLIP-L/14, และ T5 XXL โดยตัว T5 อย่างเดียวใช้พารามิเตอร์มากถึง 4.7 พันล้านพารามิเตอร์ สามารถเลือกถอดออกได้โดยกระทบกับความสวยงามเล็กน้อย แต่จะกระทบกับการวาดข้อความมากเป็นพิเศษ

ตอนนี้ผู้สนใจ SD3 ยังต้องเข้าคิวรอใช้งาน

ที่มา - Stability.AI

No Description


Topics:
Stability AI
Artificial Intelligence

อ่านต่อ...
 

ไฟล์แนบ

  • 054feefa7136e88c5b9a04df0c086f28.png
    054feefa7136e88c5b9a04df0c086f28.png
    1.9 MB · จำนวนการดู: 20

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง