แยกไฟล์ PDF ผ่าน C#

วิธีการดึงข้อความและภาพจาก PDF โดยใช้ห้องสมุด .NET

การดำเนินการยอดนิยมกับ Parser

วิธีแยกวิเคราะห์ PDF ด้วยไลบรารี .NET

คุณจำเป็นต้องแยกไฟล์ PDF หรือไม่การปรับเปลี่ยนเอกสาร PDF แบบโปรแกรมเป็นส่วนสำคัญของเวิร์กโฟลว์ดิจิทัลที่ทันสมัยด้วยไลบรารี.NET เช่น Aspose.PDF นักพัฒนาสามารถแยกข้อความจาก PDF หรือดึงรูปภาพจาก PDFไลบรารีเหล่านี้เป็นโซลูชันแบบสแตนด์อโลนที่ไม่พึ่งพาซอฟต์แวร์อื่น ๆ และพร้อมสำหรับการใช้งานเชิงพาณิชย์ครอบคลุมความต้องการที่เป็นไปได้ทั้งหมดของนักพัฒนา C# มืออาชีพ

  • แยกข้อมูล PDF: ข้อความรูปภาพแบบฟอร์มฟิลด์ ฯลฯ
  • แยกข้อความจาก PDF
  • แยกรูปภาพจาก PDF
  • แยกแบบอักษรจาก PDF
  • แยกข้อมูลจากแบบฟอร์ม
  • แยกข้อความจากแสตมป์
  • แยกข้อมูลจากตาราง

ในการแยกไฟล์ PDF เราจะใช้ Aspose.PDF for .NET API ซึ่งเป็นแอพี การจัดการเอกสารที่อุดมไปด้วยคุณสมบัติ ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม netเปิดตัวจัดการแพคเกจ NuGet ค้นหาAspose.pdf และติดตั้งคุณอาจใช้คำสั่งต่อไปนี้จากคอนโซลตัวจัดการแพคเกจ

Package Manager Console

PM > Install-Package Aspose.PDF

แยกวิเคราะห์ไฟล์ PDF ผ่าน C#


ที่จะลองรหัสในสภาพแวดล้อมของคุณคุณต้อง Aspose.PDF for .NET

1.โหลด PDF ด้วยอินสแตนซ์ของเอกสาร 1.สร้างวัตถุ TextAbsorber เพื่อแยกข้อความ 1.ยอมรับตัวดูดซับสำหรับทุกหน้า 1.รับข้อความที่แยกออกมา 1.สร้างนักเขียนและเปิดไฟล์เขียนบรรทัดข้อความลงในไฟล์

สารสกัดจากไฟล์ PDF - C#

ตัวอย่างโค้ดนี้จะแสดงวิธีการแยกเอกสาร PDF

Input file:

File not added

Output format:

PDF

Output file:

var inputFile = Path.Combine(dataDir, "ExtractTextAll.pdf");
var outputFile = Path.Combine(dataDir, "ExtractedText.txt");
var pdfDocument = new Aspose.Pdf.Document(inputFile);
var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
pdfDocument.Pages.Accept(textAbsorber);
File.WriteAllText(outputFile, textAbsorber.Text);

เกี่ยวกับ Aspose.PDF for .NET API

Aspose.PDF สำหรับ .NET API มีคุณสมบัติที่หลากหลายสำหรับการทำงานกับไฟล์ PDFคุณสมบัติบางอย่างรวมถึง:

  • สร้างเอกสาร PDF ตั้งแต่เริ่มต้นหรือจาก HTML, XML หรือรูปภาพ
  • แก้ไขเอกสาร PDF ที่มีอยู่โดยการเพิ่มหรือลบหน้า ข้อความ รูปภาพ และเนื้อหาอื่น ๆ
  • แปลงเอกสาร PDF เป็นรูปแบบอื่น ๆ เช่น HTML, XML และรูปภาพ
  • แสดงเอกสาร PDF เป็นรูปภาพหรือรูปแบบ XPS
  • พิมพ์เอกสาร PDF โดยตรงจากแอปพลิเคชันของคุณ
  • ลงนามในเอกสาร PDF แบบดิจิทัล

คุณสามารถดูข้อมูลเพิ่มเติมเกี่ยวกับ Aspose.PDF สำหรับ C# API ใน [เอกสาร Aspose] นี้ (https://docs.aspose.com/pdf/net/)