C#에서 TIFF을 DOCX로 변환
TIFF 문서에 광학 문자 인식을 수행하고 .NET 라이브러리의 Aspose.OCR을 사용하여 텍스트를 TIFF 문서로 저장합니다.
C#을 사용하여 TIFF을 DOCX로 변환하는 방법
.NET용 Aspose.OCR은 TIFF 이미지를 DOCX 문서로 변환하기 위한 강력하면서도 사용하기 쉽고 비용 효율적인 라이브러리입니다. 라틴어, 키릴 자모 및 중국어를 기반으로 하는 26개 언어를 지원하는 최신 광학 문자 인식 엔진은 수식, 신경망 및 기타 복잡한 기술 세부 사항에서 사용자를 분리하면서 뛰어난 인식 속도와 정확성을 제공합니다. 10줄 미만의 코드로 .NET 애플리케이션에 OCR 기능을 추가할 수 있습니다.
스캔한 이미지나 스마트폰 사진까지 TIFF 형식으로 처리하고 인식된 텍스트가 포함된 TIFF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR을 설치하기만 하면 됩니다.
다음 명령을 사용하여 프로젝트에 패키지를 추가합니다.
Package Manager Console Command
PM> Install-Package Aspose.OCR
TIFF을 DOCX로 변환하는 단계
.NET OCR과 몇 줄의 코드로 TIFF 이미지를 DOCX 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.
- AsposeOcr 클래스의 인스턴스 생성
- AsposeOCR.RecognizeImage 메서드 호출
- TIFF 파일 경로를 매개변수로 전달
- AsposeOCR.RecognizeImage는 DOCX 유형의 문자열 또는 파일을 반환합니다.
시스템 요구 사항
예제를 실행하기 전에 NET Standard 2.0 사양과 호환되는 .NET API가 시스템 및 모든 [외부 종속성]( https://docs.aspose.com/ocr/net/system-requirements/#external- Aspose.OCR 패키지의 종속성)이 프로젝트에서 참조됩니다.
- NET Standard 2.0+ 호환 솔루션
- 프로젝트에서 참조되는 .NET용 Aspose.OCR.
이 샘플 코드는 TIFF에서 DOCX로의 .NET 변환을 보여줍니다.
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.TIFF");
// print text
File. File.WriteAllText("document.DOCX", riText);
TIFF 무엇인가요 TIFF 파일 형식
TIFF 또는 TIF(Tagged Image File Format)는 이 파일 형식 표준을 준수하는 다양한 장치에서 사용하기 위한 래스터 이미지를 나타냅니다. 여러 색상 공간에서 이중 레벨, 회색조, 팔레트 색상 및 풀 컬러 이미지 데이터를 설명할 수 있습니다. 이 형식을 사용하는 응용 프로그램에 대해 공간과 시간 사이에서 선택하기 위해 손실 및 무손실 압축 방식을 지원합니다. 이 형식은 확장 가능하며 개인 정보 또는 특수 목적 정보를 무제한으로 포함할 수 있도록 여러 번 수정되었습니다. 형식은 시스템에 종속되지 않으며 프로세서, 운영 체제 또는 파일 시스템과 같은 범위에서 자유롭습니다.
더 읽어보기DOCX 무엇인가요 DOCX 파일 형식
DOCX는 Microsoft Word 문서용으로 잘 알려진 형식입니다. Microsoft Office 2007 릴리스와 함께 2007년부터 도입된 이 새로운 문서 형식의 구조는 일반 바이너리에서 XML과 바이너리 파일의 조합으로 변경되었습니다. Docx 파일은 Word 2007 및 측면 버전에서 열 수 있지만 DOC 파일 확장자를 지원하는 이전 버전의 MS Word에서는 열 수 없습니다.
더 읽어보기