C#에서 PDF을 XLS로 변환
PDF 문서에 광학 문자 인식을 수행하고 .NET 라이브러리의 Aspose.OCR을 사용하여 텍스트를 PDF 문서로 저장합니다.
C#을 사용하여 PDF을 XLS로 변환하는 방법
.NET용 Aspose.OCR은 PDF 이미지를 XLS 문서로 변환하기 위한 강력하면서도 사용하기 쉽고 비용 효율적인 라이브러리입니다. 라틴어, 키릴 자모 및 중국어를 기반으로 하는 26개 언어를 지원하는 최신 광학 문자 인식 엔진은 수식, 신경망 및 기타 복잡한 기술 세부 사항에서 사용자를 분리하면서 뛰어난 인식 속도와 정확성을 제공합니다. 10줄 미만의 코드로 .NET 애플리케이션에 OCR 기능을 추가할 수 있습니다.
스캔한 이미지나 스마트폰 사진까지 PDF 형식으로 처리하고 인식된 텍스트가 포함된 PDF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR을 설치하기만 하면 됩니다.
다음 명령을 사용하여 프로젝트에 패키지를 추가합니다.
Package Manager Console Command
PM> Install-Package Aspose.OCR
PDF을 XLS로 변환하는 단계
.NET OCR과 몇 줄의 코드로 PDF 이미지를 XLS 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.
- AsposeOcr 클래스의 인스턴스 생성
- AsposeOCR.RecognizeImage 메서드 호출
- PDF 파일 경로를 매개변수로 전달
- AsposeOCR.RecognizeImage는 XLS 유형의 문자열 또는 파일을 반환합니다.
시스템 요구 사항
예제를 실행하기 전에 NET Standard 2.0 사양과 호환되는 .NET API가 시스템 및 모든 [외부 종속성]( https://docs.aspose.com/ocr/net/system-requirements/#external- Aspose.OCR 패키지의 종속성)이 프로젝트에서 참조됩니다.
- NET Standard 2.0+ 호환 솔루션
- 프로젝트에서 참조되는 .NET용 Aspose.OCR.
이 샘플 코드는 PDF에서 XLS로의 .NET 변환을 보여줍니다.
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.XLS", riText);
PDF 무엇인가요 PDF 파일 형식
PDF(Portable Document Format)는 1990년대에 Adobe에서 만든 문서 유형입니다. 이 파일 형식의 목적은 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 형식으로 문서 및 기타 참조 자료를 표시하기 위한 표준을 도입하는 것입니다. PDF 파일 형식에는 원본 문서의 일부가 될 수 있는 텍스트, 이미지, 하이퍼링크, 양식 필드, 리치 미디어, 디지털 서명, 첨부 파일, 메타데이터, 지리 공간 기능 및 3D 개체와 같은 정보를 포함할 수 있는 모든 기능이 있습니다.
더 읽어보기XLS 무엇인가요 XLS 파일 형식
XLS 확장자를 가진 파일은 Excel 바이너리 파일 형식을 나타냅니다. 이러한 파일은 Microsoft Excel뿐만 아니라 OpenOffice Calc 또는 Apple Numbers와 같은 기타 유사한 스프레드시트 프로그램에서 생성할 수 있습니다. Excel에서 저장한 파일을 통합 문서라고 하며 각 통합 문서에는 하나 이상의 워크시트가 있을 수 있습니다. 데이터는 워크시트의 테이블 형식으로 저장되고 사용자에게 표시되며 숫자 값, 텍스트 데이터, 수식, 외부 데이터 연결, 이미지 및 차트에 걸쳐 있을 수 있습니다. Microsoft Excel과 같은 응용 프로그램을 사용하면 통합 문서 데이터를 PDF, CSV, XLSX, TXT, HTML, XPS 및 기타 여러 형식을 포함한 다양한 형식으로 내보낼 수 있습니다. XLS 파일 형식은 Microsoft Excel 2007 릴리스와 함께 보다 개방적이고 구조화된 형식인 XLSX로 대체되었습니다. 최신 버전은 여전히 XLS 파일 생성 및 읽기에 대한 지원을 제공하지만 XLSX가 현재 가장 먼저 사용되는 선택입니다.
더 읽어보기