แยกไฟล์ PDF ผ่าน C#

วิธีการดึงข้อความและภาพจาก PDF โดยใช้ห้องสมุด .NET

C# Java C++ Python

การดำเนินการยอดนิยมกับ Parser

ดึงข้อความ

ดึงรูปภาพ

แยกแบบอักษร

วิธีแยกวิเคราะห์ PDF ด้วยไลบรารี .NET

คุณจำเป็นต้องแยกไฟล์ PDF หรือไม่การปรับเปลี่ยนเอกสาร PDF แบบโปรแกรมเป็นส่วนสำคัญของเวิร์กโฟลว์ดิจิทัลที่ทันสมัยด้วยไลบรารี.NET เช่น Aspose.PDF นักพัฒนาสามารถแยกข้อความจาก PDF หรือดึงรูปภาพจาก PDFไลบรารีเหล่านี้เป็นโซลูชันแบบสแตนด์อโลนที่ไม่พึ่งพาซอฟต์แวร์อื่น ๆ และพร้อมสำหรับการใช้งานเชิงพาณิชย์ครอบคลุมความต้องการที่เป็นไปได้ทั้งหมดของนักพัฒนา C# มืออาชีพ

แยกข้อมูล PDF: ข้อความรูปภาพแบบฟอร์มฟิลด์ ฯลฯ
แยกข้อความจาก PDF
แยกรูปภาพจาก PDF
แยกแบบอักษรจาก PDF
แยกข้อมูลจากแบบฟอร์ม
แยกข้อความจากแสตมป์
แยกข้อมูลจากตาราง

ในการแยกไฟล์ PDF เราจะใช้ Aspose.PDF for .NET API ซึ่งเป็นแอพี การจัดการเอกสารที่อุดมไปด้วยคุณสมบัติ ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม netเปิดตัวจัดการแพคเกจ NuGet ค้นหาAspose.PDF และติดตั้งคุณอาจใช้คำสั่งต่อไปนี้จากคอนโซลตัวจัดการแพคเกจ

Package Manager Console

PM > Install-Package Aspose.PDF

แยกวิเคราะห์ไฟล์ PDF ผ่าน C#

ที่จะลองรหัสในสภาพแวดล้อมของคุณคุณต้อง Aspose.PDF for .NET

1.โหลด PDF ด้วยอินสแตนซ์ของเอกสาร 1.สร้างวัตถุ TextAbsorber เพื่อแยกข้อความ 1.ยอมรับตัวดูดซับสำหรับทุกหน้า 1.รับข้อความที่แยกออกมา 1.สร้างนักเขียนและเปิดไฟล์เขียนบรรทัดข้อความลงในไฟล์

สารสกัดจากไฟล์ PDF - C#

ตัวอย่างโค้ดนี้จะแสดงวิธีการแยกเอกสาร PDF

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

var inputFile = Path.Combine(dataDir, "ExtractTextAll.pdf");
var outputFile = Path.Combine(dataDir, "ExtractedText.txt");
var pdfDocument = new Aspose.Pdf.Document(inputFile);
var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
pdfDocument.Pages.Accept(textAbsorber);
File.WriteAllText(outputFile, textAbsorber.Text);

การดำเนินการยอดนิยมกับ Parser

วิธีแยกวิเคราะห์ PDF ด้วยไลบรารี .NET

แยกวิเคราะห์ไฟล์ PDF ผ่าน C#

สารสกัดจากไฟล์ PDF - C#

เกี่ยวกับ Aspose.PDF for .NET API