ดึงข้อความจาก PDF ใน PHP

วิธีแยกข้อความจาก PDF โดยใช้ PHP via Java

วิธีแยกข้อความจาก PDF โดยใช้ Aspose.PDF สำหรับ PHP via Java

เพื่อที่จะดึงไฟล์ PDF ข้อความเราจะใช้ Aspose.PDF for .NET API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยที่มีประสิทธิภาพและง่ายต่อการใช้ API การจัดการเอกสาร {{}} แพลตฟอร์มเปิดตัวจัดการแพคเกจ NuGet ค้นหาaspose.pdf และติดตั้งนอกจากนี้คุณยังอาจใช้คำสั่งต่อไปนี้จากคอนโซลการจัดการแพคเกจ

ดึงข้อความจาก PDF ใน PHP


คุณจำเป็นต้อง Aspose.PDF ห้องสมุด เพื่อลองรหัสในสภาพแวดล้อมของคุณ

1.โหลดไฟล์ PDF ที่มีอินสแตนซ์ของเอกสาร 1.สร้างวัตถุ TextTabSorber เพื่อดึงข้อความ 1.ยอมรับโช้คสำหรับทุกหน้า 1.ได้รับข้อความที่สกัด 1.สร้างนักเขียนและเปิดไฟล์เขียนบรรทัดของข้อความไปยังแฟ้ม

แยกข้อความจาก PDF ด้วย PHP

ตัวอย่างโค้ดนี้จะแสดงวิธีการดึงข้อความจากเอกสาร PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

เกี่ยวกับ Aspose.PDF for PHP via Java API

ไลบรารี.NET ของเราสามารถรวมเอกสารจากรูปแบบการดาวน์โหลดที่รองรับเข้ากับรูปแบบบันทึกที่รองรับใด ๆAspose.PDF สำหรับไลบรารี.NET มีโซลูชันสากลที่ค่อนข้างสากลที่จะช่วยให้คุณแก้ปัญหาการรวมเอกสารAspose.PDF รองรับรูปแบบเอกสารยอดนิยมจำนวนมากที่สุดทั้งสำหรับการโหลดและบันทึกดึงความสนใจของคุณไปที่ข้อเท็จจริงที่ว่าส่วนปัจจุบันอธิบายเฉพาะการรวมที่เป็นที่นิยมเท่านั้นหน้าปัจจุบันให้ข้อมูลเกี่ยวกับการผสาน TEXT กับ {{FILERESSULT}}อย่างไรก็ตามมีชุดค่าผสมมากมายสำหรับการรวมไฟล์ของคุณสำหรับรายการรูปแบบที่รองรับทั้งหมด โปรดดูส่วน รูปแบบไฟล์ที่รองรับ