แยกไฟล์ PDF ผ่าน C#
วิธีการดึงข้อความและภาพจาก PDF โดยใช้ห้องสมุด .NET
การดำเนินการยอดนิยมกับ Parser
วิธีแยกวิเคราะห์ PDF ด้วยไลบรารี .NET
คุณจำเป็นต้องแยกไฟล์ PDF หรือไม่การปรับเปลี่ยนเอกสาร PDF แบบโปรแกรมเป็นส่วนสำคัญของเวิร์กโฟลว์ดิจิทัลที่ทันสมัยด้วยไลบรารี.NET เช่น Aspose.PDF นักพัฒนาสามารถแยกข้อความจาก PDF หรือดึงรูปภาพจาก PDFไลบรารีเหล่านี้เป็นโซลูชันแบบสแตนด์อโลนที่ไม่พึ่งพาซอฟต์แวร์อื่น ๆ และพร้อมสำหรับการใช้งานเชิงพาณิชย์ครอบคลุมความต้องการที่เป็นไปได้ทั้งหมดของนักพัฒนา C# มืออาชีพ
- แยกข้อมูล PDF: ข้อความรูปภาพแบบฟอร์มฟิลด์ ฯลฯ
- แยกข้อความจาก PDF
- แยกรูปภาพจาก PDF
- แยกแบบอักษรจาก PDF
- แยกข้อมูลจากแบบฟอร์ม
- แยกข้อความจากแสตมป์
- แยกข้อมูลจากตาราง
ในการแยกไฟล์ PDF เราจะใช้ Aspose.PDF for .NET API ซึ่งเป็นแอพี การจัดการเอกสารที่อุดมไปด้วยคุณสมบัติ ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม netเปิดตัวจัดการแพคเกจ NuGet ค้นหาAspose.pdf และติดตั้งคุณอาจใช้คำสั่งต่อไปนี้จากคอนโซลตัวจัดการแพคเกจ
แยกวิเคราะห์ไฟล์ PDF ผ่าน C#
ที่จะลองรหัสในสภาพแวดล้อมของคุณคุณต้อง Aspose.PDF for .NET
1.โหลด PDF ด้วยอินสแตนซ์ของเอกสาร 1.สร้างวัตถุ TextAbsorber เพื่อแยกข้อความ 1.ยอมรับตัวดูดซับสำหรับทุกหน้า 1.รับข้อความที่แยกออกมา 1.สร้างนักเขียนและเปิดไฟล์เขียนบรรทัดข้อความลงในไฟล์
สารสกัดจากไฟล์ PDF - C#
ตัวอย่างโค้ดนี้จะแสดงวิธีการแยกเอกสาร PDF
Input file:
File not added
Output format:
Output file: