HTML JPG OCR XML BMP
Aspose.OCR  .NET용
DOC

C#에서 JPEG2000을 DOC로 변환

JPEG2000 문서에 광학 문자 인식을 수행하고 .NET 라이브러리의 Aspose.OCR을 사용하여 텍스트를 JPEG2000 문서로 저장합니다.

C#을 사용하여 JPEG2000을 DOC로 변환하는 방법

.NET용 Aspose.OCR은 JPEG2000 이미지를 DOC 문서로 변환하기 위한 강력하면서도 사용하기 쉽고 비용 효율적인 라이브러리입니다. 라틴어, 키릴 자모 및 중국어를 기반으로 하는 26개 언어를 지원하는 최신 광학 문자 인식 엔진은 수식, 신경망 및 기타 복잡한 기술 세부 사항에서 사용자를 분리하면서 뛰어난 인식 속도와 정확성을 제공합니다. 10줄 미만의 코드로 .NET 애플리케이션에 OCR 기능을 추가할 수 있습니다.

.NET용 Aspose.OCR

스캔한 이미지나 스마트폰 사진까지 JPEG2000 형식으로 처리하고 인식된 텍스트가 포함된 JPEG2000 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR을 설치하기만 하면 됩니다.

누겟

다음 명령을 사용하여 프로젝트에 패키지를 추가합니다.

Package Manager Console Command


  PM> Install-Package Aspose.OCR

JPEG2000을 DOC로 변환하는 단계

.NET OCR과 몇 줄의 코드로 JPEG2000 이미지를 DOC 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.

  • AsposeOcr 클래스의 인스턴스 생성
  • AsposeOCR.RecognizeImage 메서드 호출
  • JPEG2000 파일 경로를 매개변수로 전달
  • AsposeOCR.RecognizeImage는 DOC 유형의 문자열 또는 파일을 반환합니다.

시스템 요구 사항

예제를 실행하기 전에 NET Standard 2.0 사양과 호환되는 .NET API가 시스템 및 모든 [외부 종속성]( https://docs.aspose.com/ocr/net/system-requirements/#external- Aspose.OCR 패키지의 종속성)이 프로젝트에서 참조됩니다.

  • NET Standard 2.0+ 호환 솔루션
  • 프로젝트에서 참조되는 .NET용 Aspose.OCR.

이 샘플 코드는 JPEG2000에서 DOC로의 .NET 변환을 보여줍니다.


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG2000");
// print text
File. File.WriteAllText("document.DOC", riText);
  • JPEG2000 무엇인가요 JPEG2000 파일 형식

    JPEG 2000(JP2)은 이미지 코딩 시스템이자 최첨단 이미지 압축 표준입니다. 웨이블릿 기술을 사용하여 설계된 JPEG 2000은 한 번에 모든 품질의 무손실 콘텐츠를 코딩할 수 있습니다. 게다가 JPEG 2000은 코딩 효율성에 있어 실질적인 불이익 없이 동일한 콘텐츠에 액세스하고 다양한 다른 해상도와 품질로 효과적으로 디코딩할 수 있는 기능을 가지고 있습니다. JPEG 2000의 코드 스트림은 공간 랜덤 액세스를 위한 기능을 제공하는 관심 영역을 갖도록 확장할 수 있습니다. 최대 16384개의 다양한 구성 요소를 테라픽셀 단위의 치수와 38비트/샘플의 정밀도까지 보유합니다.

    더 읽어보기

    DOC 무엇인가요 DOC 파일 형식

    확장자가 .doc인 파일은 Microsoft Word 또는 기타 워드 프로세싱 문서에서 생성된 문서를 바이너리 파일 형식으로 나타냅니다. 확장은 처음에 여러 운영 체제의 일반 텍스트 문서에 사용되었습니다. 여기에는 이미지, 서식이 지정된 일반 텍스트, 그래프, 차트, 포함된 개체, 링크, 페이지, 페이지 서식, 인쇄 설정 및 기타 여러 유형의 데이터가 포함될 수 있습니다. 이 형식은 매뉴얼, 제안서, 사양, 이력서, 기사 또는 유사한 문서 작성을 위해 사용자에게 제공하는 다양한 옵션으로 인해 모든 종류의 문서에 널리 사용되었습니다. DOC의 업데이트된 버전은 사양이 공개적으로 제공되는 Office OpenXML을 기반으로 하는 DOCX입니다.

    더 읽어보기

    기타 지원되는 변환

    C#을 사용하면 다음을 포함한 다양한 형식을 쉽게 변환할 수 있습니다.

    TXT (텍스트 문서 파일)
    Text (텍스트 문서 파일)
    DOC (Microsoft Word에서 생성한 문서)
    DOCX (마이크로소프트 워드 문서)
    XLS (Microsoft Excel 이진 파일 형식)
    XLSX (마이크로소프트 엑셀 문서)
    PDF (휴대용 문서 형식(PDF))
    Searchable PDF (검색 가능한 휴대용 네트워크 그래픽)
    XML (확장 가능한 마크업 언어)
    JSON (자바스크립트 객체 표기법)