ผสาน PDF ไปยัง TEXT ผ่านทาง C#

รวมเอกสาร PDF เป็นรูปแบบเดียว TEXTใช้ Aspose.PDF สำหรับ .NET เพื่อแก้ไขไฟล์แบบโปรแกรม

ผสาน PDF กับ TEXT โดยใช้ C#

วิธีการรวมไฟล์ประเภท PDF เข้ากับไฟล์ผลลัพธ์ TEXT ทำได้อย่างไร? ด้วยไลบรารี Aspose.PDF for .NET คุณสามารถรวมไฟล์ประเภท PDF เข้ากับไฟล์ผลลัพธ์ TEXT ได้อย่างง่ายดายโดยใช้โปรแกรม ซอฟต์แวร์ PDF จาก Aspose เหมาะสำหรับบุคคลทั่วไป ธุรกิจขนาดเล็กหรือขนาดใหญ่ เนื่องจากสามารถประมวลผลข้อมูลจำนวนมาก ทำการรวมไฟล์ได้อย่างรวดเร็วและมีประสิทธิภาพ และปกป้องข้อมูลของคุณ คุณสมบัติพิเศษของ Aspose.PDF คือ API สำหรับการรวมไฟล์ประเภท PDF เข้ากับไฟล์ผลลัพธ์ TEXT

ข้อดีของวิธีนี้คือ คุณเพียงแค่เปิดตัวจัดการแพ็กเกจ NuGet ค้นหา ‘Aspose.PDF for .NET’ และติดตั้งโดยไม่ต้องตั้งค่าที่ซับซ้อนใดๆ (ใช้คำสั่งจาก Package Manager Console ในการติดตั้ง) ในการแปลง PDF เป็น TEXT เราจะใช้ API ของ Aspose.PDF for .NET ซึ่งเป็น API สำหรับการแปลงไฟล์ที่มีฟีเจอร์ครบครัน ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม .NET ตรวจสอบรายละเอียดการติดตั้งไลบรารีได้ที่หน้า เอกสารประกอบ หากต้องการทดสอบประโยชน์ของไลบรารี ลองใช้โค้ดตัวอย่างการแปลง PDF เป็น TEXT ดู

Package Manager Console

PM > Install-Package Aspose.PDF

วิธีการผสาน PDF ไปยัง TEXT ผ่านทาง C#


.NET นักพัฒนาสามารถโหลดและผสานไฟล์ PDF ไปยัง TEXT ในเพียงไม่กี่บรรทัดของโค้ด

  1. อ่านไฟล์ PDF สองไฟล์
  2. การสร้างตัวดูดซับข้อความ
  3. การแยกข้อความจาก PDF โดยใช้ TextAbsorber กับไฟล์ PDF ทั้งสอง
  4. การจัดเก็บข้อความที่แยกออกมา
  5. การเขียนข้อความที่แยกออกไปยังไฟล์

นี่คือตัวอย่างที่แสดงให้เห็นถึงวิธีการผสาน PDF กับ TEXT ใน C#รวมเอกสารหลายฉบับเป็นไฟล์เดียวได้อย่างง่ายดายหากคุณกำลังพัฒนาโค้ดใน C# งานนี้อาจง่ายกว่าที่ฟังคุณสามารถใช้ชื่อไฟล์ที่มีคุณสมบัติครบถ้วนสำหรับการอ่าน PDF และการเขียน TEXTดูตัวอย่าง C# นี้ที่แสดงวิธีรวมเอกสารหลายประเภทของไฟล์เดียวกันหรือไฟล์ที่แตกต่างกันเป็นไฟล์เดียวกันโดยใช้ C#

ผสานไฟล์ PDF โดยใช้ .NET และบันทึกเป็น TEXT

ตัวอย่าง C#: ตัวอย่างรหัสนี้แสดง PDF ถึง TEXT เรียงต่อกัน

Input file:

File not added

File not added

Output format:

TEXT

Output file:

var inputFile1 = Path.Combine(dataDir, "1.pdf");
var inputFile2 = Path.Combine(dataDir, "2.pdf");
var outputFile = Path.Combine(dataDir, "merger_pdf_txt.txt");

using var pdfDocument1 = new Aspose.Pdf.Document(inputFile1);
using var pdfDocument2 = new Aspose.Pdf.Document(inputFile2);
pdfDocument1.Merge(pdfDocument2);

var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
textAbsorber.Visit(pdfDocument1);
string extractedText = textAbsorber.Text;
File.WriteAllText(outputFile, extractedText);

API สำหรับ C# เพื่อรวม PDF เข้ากับ TEXT

Aspose.PDF สำหรับ C# API ให้ความหลากหลายของคุณสมบัติสำหรับการทำงานกับไฟล์ PDFคุณสมบัติบางอย่างรวมถึง:

  • สร้างเอกสาร PDF ตั้งแต่เริ่มต้นหรือจาก HTML, XML หรือรูปภาพ
  • แก้ไขเอกสาร PDF ที่มีอยู่โดยการเพิ่มหรือลบหน้า ข้อความ รูปภาพ และเนื้อหาอื่น ๆ
  • แปลงเอกสาร PDF เป็นรูปแบบอื่น ๆ เช่น HTML, XML, และภาพ
  • แสดงเอกสาร PDF เป็นรูปภาพหรือรูปแบบ XPS
  • พิมพ์เอกสาร PDF ได้โดยตรงจากใบสมัครของคุณ
  • ลงนามแบบดิจิทัลในเอกสาร PDF

คุณสามารถค้นหาข้อมูลเพิ่มเติมเกี่ยวกับ Aspose.PDF สำหรับ C# API ในนี้ กำหนดเอกสาร