PHP 를 통해 PDF 추출

PHP via Java 라이브러리를 사용하여 PDF에서 텍스트 및 이미지를 추출하는 방법

파서에서 가장 많이 사용되는 액션

PHP via Java 라이브러리를 사용하여 PDF를 파싱하는 방법

PDF 파일을 추출하기 위해 php-java 플랫폼을 위한 기능이 풍부하고 강력하며 사용하기 쉬운 문서 조작 API인 Aspose.PDF for .NET API를 사용할 것입니다.NuGet 패키지 관리자를 열고 ASpose.pdf를 검색한 다음 설치합니다.패키지 관리자 콘솔에서 다음 명령을 사용할 수도 있습니다.

PHP 를 통해 PDF 구문 분석


사용자 환경에서 코드를 테스트하려면 Aspose.PDF 라이브러리 가 필요합니다.

  1. 문서 인스턴스와 함께 PDF를 로드합니다.
  2. 텍스트 흡수기 객체를 만들어 텍스트를 추출합니다.
  3. 모든 페이지의 업소버를 수락하십시오.
  4. 추출된 텍스트 가져오기
  5. 라이터를 만들고 파일을 열고 파일에 텍스트 한 줄을 씁니다.

PDF 파일 추출 - PHP

이 샘플 코드는 PDF 문서를 추출하는 방법을 보여줍니다.

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

Aspose.PDF for PHP via Java API에 대하여

.NET 라이브러리는 지원되는 모든 다운로드 형식의 문서를 지원되는 저장 형식으로 결합할 수 있습니다..NET 라이브러리용 Aspose.PDF 라이브러리는 문서 병합 작업을 해결하는 데 도움이 되는 상당히 보편적인 솔루션을 제공합니다.Aspose.PDF 로딩 및 저장에 가장 많이 사용되는 문서 형식을 지원합니다.현재 섹션에서는 자주 사용되는 병합에 대해서만 설명한다는 점에 유의하세요.현재 페이지에서는 {{FILETYPE}} 를 {{FILERESULT}} 에 병합하는 방법에 대한 정보를 제공합니다.하지만 파일을 병합할 수 있는 여러 가지 조합이 있습니다.지원되는 형식의 전체 목록은 지원되는 파일 형식 섹션을 참조하십시오.