แยกไฟล์ PDF ผ่าน PHP

วิธีการดึงข้อความและภาพจาก PDF โดยใช้ห้องสมุด PHP via Java

การดำเนินการยอดนิยมกับ Parser

วิธีแยกวิเคราะห์ PDF ด้วยไลบรารี PHP via Java

ในการแยกไฟล์ PDF เราจะใช้ Aspose.PDF for .NET API ซึ่งเป็น API จัดการเอกสารที่อุดมด้วยคุณสมบัติ ทรงพลัง และใช้งานง่ายสำหรับแพลตฟอร์ม php-javaเปิดตัวจัดการแพคเกจ NuGet ค้นหาAspose.pdf และติดตั้งคุณอาจใช้คำสั่งต่อไปนี้จากคอนโซลตัวจัดการแพคเกจ

แยกวิเคราะห์ไฟล์ PDF ผ่าน PHP


คุณจำเป็นต้อง Aspose.PDF ห้องสมุด เพื่อลองรหัสในสภาพแวดล้อมของคุณ

1.โหลด PDF ด้วยอินสแตนซ์ของเอกสาร 1.สร้างวัตถุ TextAbsorber เพื่อแยกข้อความ 1.ยอมรับตัวดูดซับสำหรับทุกหน้า 1.รับข้อความที่แยกออกมา 1.สร้างนักเขียนและเปิดไฟล์เขียนบรรทัดข้อความลงในไฟล์

สารสกัดจากไฟล์ PDF - PHP

ตัวอย่างโค้ดนี้จะแสดงวิธีการแยกเอกสาร PDF

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

เกี่ยวกับ Aspose.PDF for PHP via Java API

ไลบรารี.NET ของเราสามารถรวมเอกสารจากรูปแบบการดาวน์โหลดที่รองรับเข้ากับรูปแบบบันทึกที่รองรับใด ๆAspose.PDF สำหรับไลบรารี.NET มีโซลูชันสากลที่ค่อนข้างสากลที่จะช่วยให้คุณแก้ปัญหาการรวมเอกสารAspose.PDF รองรับรูปแบบเอกสารยอดนิยมจำนวนมากที่สุดทั้งสำหรับการโหลดและบันทึกดึงความสนใจของคุณไปที่ข้อเท็จจริงที่ว่าส่วนปัจจุบันอธิบายเฉพาะการรวมที่เป็นที่นิยมเท่านั้นหน้าปัจจุบันให้ข้อมูลเกี่ยวกับการผสาน {{FILETYPE}} กับ {{FILERESSULT}}อย่างไรก็ตามมีชุดค่าผสมมากมายสำหรับการรวมไฟล์ของคุณสำหรับรายการรูปแบบที่รองรับทั้งหมด โปรดดูส่วน รูปแบบไฟล์ที่รองรับ