สารสกัดจากข้อมูลเมตาของ PDF ผ่าน Python

วิธีการแก้ไขข้อมูลเมตาของ PDF โดยใช้ห้องสมุด Python for .NET

วิธีการแยกข้อมูลเมตาดาต้า PDF โดยใช้ Python for .NET ห้องสมุด

เพื่อที่จะดึงข้อมูลเมตาจากไฟล์ PDF เราจะใช้ Aspose.PDF for .NET API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยมีประสิทธิภาพและง่ายต่อการใช้งานการจัดการเอกสาร API สำหรับ .NETเปิดตัวจัดการแพคเกจ NuGet ค้นหาaspose.pdf และติดตั้งนอกจากนี้คุณยังอาจใช้คำสั่งต่อไปนี้จากคอนโซลการจัดการแพคเกจ

Python Package Manager Console

pip install aspose-pdf

สารสกัดจากข้อมูลเมตาของ PDF ผ่าน Python


ที่จะลองรหัสในสภาพแวดล้อมของคุณคุณต้อง Aspose.PDF for .NET

1.โหลดไฟล์ PDF ที่มีอินสแตนซ์ของเอกสาร 1.รับ DocumentInfo ใช้คุณสมบัติ Document.Info 1.การเข้าถึงและแสดงคุณสมบัติ Document.Info ที่แตกต่างกัน

<% metadata.code-block.text %>

สารสกัดจากข้อมูลเมตาของ PDF - Python

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:

    import aspose.pdf as ap 

    # Open document
    pdf_document = ap.Document(DIR_INPUT_METADATA + "GetFileInfo.pdf")
    # Get document information
    doc_info = pdf_document.info
    # Show document information
    print("Author :", doc_info.author)
    print("Creation Date :", doc_info.creation_date)
    print("Keywords :", doc_info.keywords)
    print("Modify Date :", doc_info.mod_date)
    print("Subject :", doc_info.subject)
    print("Title :", doc_info.title)