สารสกัดจากข้อมูลเมตาของ PDF ผ่าน Java

แยกข้อมูลเมตาจากเอกสาร PDFใช้ Aspose.PDF สำหรับ Java เพื่อแก้ไขไฟล์ PDF แบบโปรแกรม

C# Java C++ Python

วิธีการแยกข้อมูลเมตาดาต้า PDF โดยใช้ Java ห้องสมุด

แยกข้อมูลเมตาจาก PDF โดยใช้ Aspose.PDF สำหรับ Javaการเข้าถึงข้อมูลเมตาของเอกสารหมายถึงการรับข้อมูลเกี่ยวกับไฟล์นั้น เช่น ชื่อเรื่อง ผู้เขียน เมื่อสร้างขึ้น และคำหลักที่เฉพาะเจาะจงแยกข้อมูลเมตาช่วยจัดระเบียบคอลเลกชัน PDF ขนาดใหญ่ได้อย่างมีประสิทธิภาพมากขึ้นข้อมูลที่ดึงออกมาจากข้อมูลเมตาจะช่วยปรับปรุงวิธีค้นหาไฟล์ได้ผู้ใช้สามารถค้นหาเอกสารเฉพาะได้อย่างรวดเร็วโดยใช้คำหลักหรือรายละเอียดที่พบในข้อมูลเมตาที่แยกออกมาการแยกข้อมูลเมตาให้ข้อมูลเชิงลึกที่มีคุณค่าเกี่ยวกับสิ่งที่ไฟล์มีอยู่อาจให้สรุปโดยย่อของรายละเอียดที่สำคัญเกี่ยวกับไฟล์ ทำให้เข้าใจว่าเอกสารเกี่ยวกับอะไรได้ง่ายขึ้นโดยไม่ต้องเปิดการแยกข้อมูลเมตาจะช่วยให้แน่ใจว่าเอกสารนั้นเป็นของแท้คุณสามารถตรวจสอบรายละเอียด เช่น ชื่อของผู้เขียนเมื่อสร้างขึ้นหรือประวัติการดัดแปลงการตรวจสอบนี้มีความสำคัญต่อการยืนยันความน่าเชื่อถือ PDFด้วยการนำเสนอรายละเอียดที่กระชับเกี่ยวกับเนื้อหาของ PDF ข้อมูลเมตาที่แยกออกมาจะทำให้ประสบการณ์ของผู้ใช้ดีขึ้นมากช่วยให้ผู้ใช้ระบุและทำงานกับเอกสารได้อย่างง่ายดายโดยรวมแล้ว การแยกข้อมูลเมตาของ PDF ให้ข้อดีหลายประการ เช่น การจัดการเอกสารที่มีประสิทธิภาพมากขึ้น ตัวเลือกการค้นหาที่ดีขึ้น การปฏิบัติตามมาตรฐาน และประสบการณ์ผู้ใช้ที่ได้รับการปรับปรุงโดยรวมแยกข้อมูลเมตาจาก PDF ผ่าน Aspose และแก้ไขงานที่จำเป็นทั้งหมดในการทำงานกับข้อมูลในการแยกข้อมูลเมตาจากไฟล์ PDF เราจะใช้ Aspose.PDF for Java API ซึ่งเป็น API การแปลงที่อุดมด้วยคุณสมบัติ ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม Javaคุณสามารถดาวน์โหลดเวอร์ชันล่าสุดได้โดยตรงจาก Maven และติดตั้งภายในโครงการที่ใช้ Maven ของคุณโดยการเพิ่มการกำหนดค่าต่อไปนี้ลงในpom.xml

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

สารสกัดจากข้อมูลเมตาของ PDF ผ่าน Java

คุณจำเป็นต้อง Aspose.PDF forห้องสมุด Java เพื่อลองรหัสในสภาพแวดล้อมของคุณ

1.โหลดไฟล์ PDF ที่มีอินสแตนซ์ของเอกสาร 1.รับ DocumentInfo ใช้คุณสมบัติ Document.Info 1.การเข้าถึงและแสดงคุณสมบัติ Document.Info ที่แตกต่างกัน

ส่วนประกอบรหัส Java ที่ให้มาแสดงวิธีการแยกข้อมูลเมตาจาก PDF โดยไลบรารี Aspose.PDFมันเปิดไฟล์ PDF ชื่อ ‘GetFileInfo.pdf’ ซึ่งอยู่ในไดเรกทอรีที่ระบุโดยตัวแปร ‘DIR_INPUT_METADATA’รหัสจะดึงรายละเอียดต่างๆจากเอกสารโดยใช้ฟังก์ชัน ‘ข้อมูล’จะแสดงข้อมูลเมตาที่เฉพาะเจาะจงจาก PDF เช่นชื่อผู้เขียนวันที่สร้างคำหลักวันที่แก้ไขหัวเรื่องและชื่อเรื่องรหัสใช้ฟังก์ชัน ‘พิมพ์’ เพื่อแสดงข้อมูลนี้ส่วนประกอบโค้ดนี้เป็นตัวอย่างที่เรียบง่ายของวิธีที่คุณอาจใช้ไลบรารีหรือเฟรมเวิร์ก Aspose.PDF เพื่อแยกข้อมูลเมตาจากไฟล์ PDF

แยกข้อมูลเมตาของ PDF - Java

รหัสตัวอย่างนี้แสดงวิธีแยกข้อมูลเมตาดาต้าของไฟล์ PDF

Input file:

Upload a file

File not added

Output format:

Output file:

Document pdfDocument = new Document(DATA_DIR.resolve("sample.pdf").toString());
// Get document information
DocumentInfo docInfo = pdfDocument.getInfo();
// Show document information
System.out.println("Author: " + docInfo.getAuthor());
System.out.println("Creation Date: " + docInfo.getCreationDate());
System.out.println("Keywords: " + docInfo.getKeywords());
System.out.println("Modify Date: " + docInfo.getModDate());
System.out.println("Subject: " + docInfo.getSubject());
System.out.println("Title: " + docInfo.getTitle());
pdfDocument.close();