กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


ข่าว ไมโครซอฟท์ออก MarkItDown ไลบรารีสำหรับแปลงไฟล์ Office เป็น Markdown

News 

Moderator
สมาชิกทีมงาน
Moderator
Verify member
เข้าร่วม
1 มิถุนายน 2011
ข้อความ
10,286
  • กระทู้ ผู้เขียน
  • #1
ไมโครซอฟท์ออก MarkItDown ไลบรารีภาษาไพธอนสำหรับแปลงเอกสารในชุด Microsoft Office (.docx, .xlsx, .pttx) รวมถึงไฟล์ PDF, HTML ให้อยู่ในฟอร์แมต Markdown

เนื่องจาก MarkItDown ออกแบบมาเป็นไลบรารี วิธีการใช้งานจึงต้องเรียกผ่านการเขียนโค้ด Python สั้นๆ ตามตัวอย่าง

from markitdown import MarkItDown

markitdown = MarkItDown()
result = markitdown.convert("test.xlsx")
print(result.text_content)

เป้าหมายของ MarkItDown คือแปลงไฟล์เอกสารประเภทต่างๆ มาเป็น Markdown ฟอร์แมตเดียว เพื่อให้สะดวกกับการนำไปประมวลผลต่อในงานอื่นๆ เช่น วิเคราะห์ข้อมูลประเภทข้อความ ตัวไลบรารีเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ MIT

ที่มา - Microsoft GitHub

No Description


Topics:
Microsoft Office
Microsoft
Open Source

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม