โซลูชันการสกัดเอกสาร PDF

ดึงรูปภาพและข้อความจากเอกสาร PDF ด้วยแอพและ API ข้ามแพลตฟอร์มฟรี

วิธีการแยกวิเคราะห์ไฟล์ PDF โดยใช้ห้องสมุด Aspose

ทำไมต้องแยกวิเคราะห์เอกสาร PDF ในการแยกไฟล์ PDF เราจะใช้ Aspose.PDF API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยมีประสิทธิภาพและง่ายต่อการใช้งานการจัดการเอกสาร APIเปิดตัวจัดการแพคเกจ NuGet ค้นหา Aspose.PDF และติดตั้งนอกจากนี้คุณยังอาจใช้คำสั่งต่อไปนี้จากคอนโซลการจัดการแพคเกจแยกเอกสาร PDF เป็นคำที่ปล่อยออกมาเพื่อการสกัดชนิดที่แตกต่างกันของข้อมูลจากไฟล์ PDFแยกวิเคราะห์เอกสาร PDF เพื่อดึงข้อความและภาพนอกจากนี้สำหรับการแยก PDF เป็นข้อความและภาพAspose.PDF Library ช่วยให้คุณสามารถดึงข้อความจาก PDF และจากแสตมป์ดึงภาพและแบบอักษรจาก PDF ดึงข้อมูลจากตารางและแบบฟอร์ม

API รหัสสูงเพื่อแยกวิเคราะห์เอกสาร APIs พื้นเมืองไปยังไฟล์ PDF โดยใช้.NET, .NET หลัก Java, C++ และ Android

แยกวิเคราะห์ไฟล์ PDF

// Open document
Document pdfDocument = new Document(dataDir + "ExtractTextAll.pdf");

// Create TextAbsorber object to extract text
TextAbsorber textAbsorber = new TextAbsorber();
// Accept the absorber for all the pages
pdfDocument.Pages.Accept(textAbsorber);
// Get the extracted text
string extractedText = textAbsorber.Text;
// Create a writer and open the file
TextWriter tw = new StreamWriter(dataDir + "extracted-text.txt");
// Write a line of text to the file
tw.WriteLine(extractedText);
// Close the stream
tw.Close();