JavaScript 에서 PDF에서 텍스트 추출

Node.js via C++ 라이브러리를 사용하여 PDF에서 텍스트를 추출하는 방법

Node.js via C++ 라이브러리를 사용하여 PDF에서 텍스트를 추출하는 방법

텍스트 PDF 파일을 추출하기 위해 nodejs-cpp 플랫폼을 위한 기능이 풍부하고 강력하며 사용하기 쉬운 Aspose.PDF for .NET API를 사용합니다.NuGet 패키지 관리자를 열고 Aspose.pdf를 검색하여 설치합니다.패키지 관리자 콘솔에서 다음 명령을 사용할 수도 있습니다.

JavaScript 에서 PDF에서 텍스트 추출


사용자 환경에서 코드를 사용해 보려면 Aspose.PDF 라이브러리 가 필요합니다.

1.문서 인스턴스와 함께 PDF를 로드합니다. 1.텍스트를 추출하는 TextAbsorber 객체를 생성합니다. 1.모든 페이지에 흡수 장치를 사용하십시오. 1.추출된 텍스트 가져오기 1.라이터 생성 및 파일 열기, 파일에 텍스트 한 줄 쓰기

PDF에서 텍스트 추출 - JavaScript

이 샘플 코드는 PDF 문서에서 텍스트를 추출하는 방법을 보여줍니다.

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Node.js via C++ API용 Aspose.PDF 정보

.NET 라이브러리는 지원되는 모든 다운로드 형식의 문서를 지원되는 모든 저장 형식으로 결합할 수 있습니다..NET 용 Aspose.PDF 라이브러리는 문서 병합 작업을 해결하는 데 도움이되는 상당히 보편적 인 솔루션을 제공합니다.Aspose.PDF 는 로드 및 저장 모두에서 가장 많이 사용되는 문서 형식을 지원합니다.현재 섹션에서는 인기 있는 병합만 설명한다는 점에 주목하세요.현재 페이지는 TEXT 을 {{FILERESULT}} 에 병합하는 방법에 대한 정보를 제공합니다.하지만 파일 병합에는 여러 가지 조합이 있습니다.지원되는 형식의 전체 목록은 지원되는 파일 형식 섹션을 참조하십시오.