HTML JPG OCR XML BMP
Aspose.OCR  .NET용
Searchable PDF

C#에서 GIF을 Searchable PDF로 변환

GIF 문서에 광학 문자 인식을 수행하고 .NET 라이브러리의 Aspose.OCR을 사용하여 텍스트를 GIF 문서로 저장합니다.

C#을 사용하여 GIF을 Searchable PDF로 변환하는 방법

.NET용 Aspose.OCR은 GIF 이미지를 Searchable PDF 문서로 변환하기 위한 강력하면서도 사용하기 쉽고 비용 효율적인 라이브러리입니다. 라틴어, 키릴 자모 및 중국어를 기반으로 하는 26개 언어를 지원하는 최신 광학 문자 인식 엔진은 수식, 신경망 및 기타 복잡한 기술 세부 사항에서 사용자를 분리하면서 뛰어난 인식 속도와 정확성을 제공합니다. 10줄 미만의 코드로 .NET 애플리케이션에 OCR 기능을 추가할 수 있습니다.

.NET용 Aspose.OCR

스캔한 이미지나 스마트폰 사진까지 GIF 형식으로 처리하고 인식된 텍스트가 포함된 GIF 문서를 만듭니다. 프로젝트에 추가하려면 Aspose.OCR을 설치하기만 하면 됩니다.

누겟

다음 명령을 사용하여 프로젝트에 패키지를 추가합니다.

Package Manager Console Command


  PM> Install-Package Aspose.OCR

GIF을 Searchable PDF로 변환하는 단계

.NET OCR과 몇 줄의 코드로 GIF 이미지를 Searchable PDF 문서로 변환하는 완전한 기능의 애플리케이션을 만들 수 있습니다.

  • AsposeOcr 클래스의 인스턴스 생성
  • AsposeOCR.RecognizeImage 메서드 호출
  • GIF 파일 경로를 매개변수로 전달
  • AsposeOCR.RecognizeImage는 Searchable PDF 유형의 문자열 또는 파일을 반환합니다.

시스템 요구 사항

예제를 실행하기 전에 NET Standard 2.0 사양과 호환되는 .NET API가 시스템 및 모든 [외부 종속성]( https://docs.aspose.com/ocr/net/system-requirements/#external- Aspose.OCR 패키지의 종속성)이 프로젝트에서 참조됩니다.

  • NET Standard 2.0+ 호환 솔루션
  • 프로젝트에서 참조되는 .NET용 Aspose.OCR.

이 샘플 코드는 GIF에서 Searchable PDF로의 .NET 변환을 보여줍니다.


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.GIF");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
  • GIF 무엇인가요 GIF 파일 형식

    GIF 또는 그래픽 교환 형식은 고도로 압축된 이미지 유형입니다. Unisys가 소유한 GIF는 이미지 품질을 저하시키지 않는 LZW 압축 알고리즘을 사용합니다. 각 이미지에 대해 GIF는 일반적으로 픽셀당 최대 8비트를 허용하고 이미지 전체에 최대 256색을 허용합니다. 최대 1600만 색상을 표시할 수 있고 인간의 눈의 한계에 상당히 닿는 JPEG 이미지와 대조적입니다. 인터넷이 등장했을 때 GIF는 낮은 대역폭이 필요하고 단색 영역을 소비하는 그래픽과 호환되기 때문에 최고의 선택으로 남아 있었습니다. 애니메이션 GIF는 수많은 이미지 또는 프레임을 단일 파일로 결합하고 이를 시퀀스로 표시하여 애니메이션 클립 또는 짧은 비디오를 생성합니다. 색상 제한은 각 프레임에 대해 최대 256개이며 색상 그라디언트가 있는 다른 이미지 및 사진을 재생하는 데 가장 적합하지 않을 수 있습니다.

    더 읽어보기

    Searchable PDF 무엇인가요 Searchable PDF 파일 형식

    검색 가능한 PDF 파일은 문서 내에서 전체 텍스트 검색에 사용하거나 복사 및 붙여넣기 작업을 위해 텍스트를 강조 표시하는 데 사용할 수 있는 숨겨진 레이어의 OCR 텍스트뿐만 아니라 볼 수 있도록 원본 스캔 이미지를 유지합니다. 원본 이미지를 포함하지 않는 PDF로의 전체 OCR 변환은 특히 문서에 이미지가 많거나 복잡한 레이아웃이 있는 경우 원본 형식을 100% 유지하지 않습니다.

    더 읽어보기

    기타 지원되는 변환

    C#을 사용하면 다음을 포함한 다양한 형식을 쉽게 변환할 수 있습니다.

    TXT (텍스트 문서 파일)
    Text (텍스트 문서 파일)
    DOC (Microsoft Word에서 생성한 문서)
    DOCX (마이크로소프트 워드 문서)
    XLS (Microsoft Excel 이진 파일 형식)
    XLSX (마이크로소프트 엑셀 문서)
    PDF (휴대용 문서 형식(PDF))
    Searchable PDF (검색 가능한 휴대용 네트워크 그래픽)
    XML (확장 가능한 마크업 언어)
    JSON (자바스크립트 객체 표기법)