บริการ large language model (LLM) บนคลาวด์รายต่างๆ เปิดทางให้องค์กรสร้างแอปพลิเคชั่นสสำหรับงานเฉพาะทาง เช่น โดยเฉพาะการทำ Retrieval Augmented Generation (RAG) เพื่อสร้างแชตบอตสอบถามข้อมูลเฉพาะทาง ทาง AWS ก็ออกมาแนะนำ 8 ประเด็นที่ต้องระวังด้านความปลอดภัย
แอปแชตที่ AWS ยกตัวอย่างมาประกอบไปด้วย หน้าจอเว็บที่พัฒนาด้วย Streamlit, ตัวแอปพลิเคชั่นหลักพัฒนาด้วย Lambda, ฐานข้อมูล DynamoDB สำหรับการเก็บข้อมูลประวัติการแชตก่อนหน้า, เชื่อมต่อกับ LLM หลักคือ Cluade 3 Sonnet, ดึงข้อมูลเอกสารจาก S3 เข้าไปยัง OpenSearch โดยแปลงข้อความเป็นเวคเตอร์ด้วย Titan Embedding
ข้อควรระวัง 8 ประการที่ AWS แนะนำไว้ได้แก่
AWS ระบุว่าแอปพลิเคชั่นแชต LLM นั้นยังคงจำเป็นต้องมีความปลอดภัยเทียบเท่ากับแอปพลิเคชั่นองค์กรอื่นๆ การควบคุมการดูแลความปลอดภัยจึงมีการควบคุมแบบเดียวกัน
ที่มา - AWS Blog
Topics:
AWS
LLM
Continue reading...
แอปแชตที่ AWS ยกตัวอย่างมาประกอบไปด้วย หน้าจอเว็บที่พัฒนาด้วย Streamlit, ตัวแอปพลิเคชั่นหลักพัฒนาด้วย Lambda, ฐานข้อมูล DynamoDB สำหรับการเก็บข้อมูลประวัติการแชตก่อนหน้า, เชื่อมต่อกับ LLM หลักคือ Cluade 3 Sonnet, ดึงข้อมูลเอกสารจาก S3 เข้าไปยัง OpenSearch โดยแปลงข้อความเป็นเวคเตอร์ด้วย Titan Embedding
ข้อควรระวัง 8 ประการที่ AWS แนะนำไว้ได้แก่
- ไม่ได้ป้องกันแอปด้วยการล็อกอิน: การเปิดให้ใช้งานแอปโดยไม่ได้ล็อกให้ผู้ใช้ที่ยืนยันตัวตนแล้วนำมาสู่ปัญหาจำนวนมาก ผู้ใช้ที่ไม่ได้ผ่านการยืนยันตัวตนอาจจะปลอมตัวเป็นผู้ใช้คนอื่นเพื่อขโมยข้อมูล หรือโจมตีระบบ
- ไม่กรองอินพุตผู้ใช้: แอปไม่ได้กรอง (sanitize) ข้อความแชตที่เข้ามาให้ดีพอ ทำให้คนร้ายสามารถโจมตีแอปก่อนที่จะเชื่อมต่อกับ LLM เสียอีก เช่น เข้าไปดึงข้อมูลจาก DynamoDB คนร้ายใส่สัญลักษณ์ต่างๆ ที่แอปพลิเคชั่นไม่ได้รองรับไว้ดีพอ
- การเชื่อมต่อระหว่างส่วนต่างๆ ไม่ปลอดภัย: การเชื่อมต่อระหว่างส่วนต่างๆ ในแอปพลิเคชั่นไม่ได้มีการป้องกันดีพอ อาจจะเปิดทางให้มีการทำ man-in-the-middle หรือเชื่อมต่อเข้าไปยังส่วนต่างๆ ได้โดยตรง
- เก็บ log ไม่ละเอียดพอ: กระบวนการเก็บ log ไม่เพียงพอที่จะตรวจสอบย้อนกลับได้ ทำให้วิเคราะห์ปัญหาได้ยากในกรณีที่ถูกโจมตีขึ้นมา
- เก็บข้อมูลไม่ปลอดภัย: ข้อมูลที่เก็บไว้ เช่น ฐานข้อมูลความรู้ภายในที่เก็บบน S3 หรือประวัติการใช้งานใน DynamoDB ไม่ได้มีการกำหนดสิทธิ์การเข้าถึงอย่างละเอียด ไม่ได้เข้ารหัสข้อมูลสำคัญ
- ละเลยควาามปลอดภัยตัวโมเดล LLM: แม้ตัว LLM จะเป็นโมเดลที่ตอบตามอินพุต แต่การใช้งานอย่างไม่ระมัดระวังเปิดทางให้คนร้ายโจมตีจนแอปล่ม หรือสับเปลี่ยนโมเดลจนคำตอบเปลี่ยนไป
- ไม่มีนโยบายควบคุมจริยธรรมในการใช้ AI: ควรมีแนวทางควบคุมการใช้งาน มีการวัดผลความเสี่ยงต่างๆ อย่างเป็นระบบ ตรวจสอบชุดข้อมูลที่ใช้ฝึกว่าไม่มีการลำเอียงกับคนกลุ่มใดเป็นพิเศษ
- ไม่มีการทดสอบเต็มรูปแบบ: ระบบควรมีการทดสอบเต็มรูปแบบครบทั้งแอปพลิเคชั่นว่าแอปมีความสามารถตอบคำถามได้อย่างถูกต้อง
AWS ระบุว่าแอปพลิเคชั่นแชต LLM นั้นยังคงจำเป็นต้องมีความปลอดภัยเทียบเท่ากับแอปพลิเคชั่นองค์กรอื่นๆ การควบคุมการดูแลความปลอดภัยจึงมีการควบคุมแบบเดียวกัน
ที่มา - AWS Blog
Topics:
AWS
LLM
Continue reading...