C++에서 이미지와 PDF를 텍스트로 변환

몇 줄의 코드로 C++ 애플리케이션에 광학 문자 인식(OCR)을 추가하십시오.

C++용 Aspose.OCR은 5 줄의 코드로 광학 문자 인식 기능으로 응용 프로그램을 확장합니다. 신경망 및 기계 학습에 대한 우리의 경험은 중국어 뿐만 아니라 라틴어 및 키릴 문자 를 기반으로 하는 26 개 언어를 지원하는 탁월한 성능과 정확성을 갖춘 OCR 라이브러리로 번역되었습니다. OCR API는 스캔한 이미지, 스마트폰 사진, 스크린샷, 이미지 영역 및 스캔한 PDF를 인식하고 가장 널리 사용되는 문서 및 데이터 교환 형식으로 결과를 반환할 수 있습니다. 완전히 오프라인이며 작동하기 위해 인터넷 연결이 필요하지 않습니다. API는 시작하는 데 최소한의 노력이 필요하고 마스터하는 데 얕은 학습 곡선이 필요합니다. 모든 전처리, 왜곡 보정, 노이즈 제거, 언어 감지, 멀티 스레딩 및 기타 복잡한 작업이 자동으로 수행되지만 어려운 경우를 처리하도록 조정할 수 있습니다.

한눈에

광학 문자 인식 기능에 대한 간략한 요약입니다.

핵심 기능

사진에서 텍스트 추출
검색 가능한 PDF 만들기
자동 이미지 보정
여러 서체 지원
텍스트 서식 유지
텍스트 조각 감지
일괄 처리
맞춤법 검사

지원되는 언어

영어
중국어
독일어
프랑스어
이탈리아어
스페인어
러시아어
체코어
폴란드어
우크라이나어
네덜란드 어
에스토니아어
10개 이상

Aspose.OCR

플랫폼 독립성

OCR 라이브러리는 Windows 및 Linux용 C++ 응용 프로그램을 완벽하게 지원합니다.

Windows 64 bit

Linux 64 bit

Aspose.OCR

지원되는 파일 형식

스캐너나 카메라에서 가져온 모든 파일을 가장 널리 사용되는 문서 및 데이터 교환 형식으로 변환합니다.

소스 파일

PDF
JPEG
PNG
TIFF
BMP

인정 결과

검색 가능한 PDF
Microsoft Word
Microsoft Excel
일반 텍스트
JSON
XML

Aspose.OCR

고급 C++ OCR API 기능

이미지에서 텍스트를 추출하고 검색 가능한 PDF 생성

스캐너 또는 카메라에서 얻을 수 있는 모든 이미지 지원

확장된 라틴어 및 키릴 문자 읽기

6,000개 이상의 한자 인식

모든 인기 있는 서체와 서식을 감지하고 인식합니다.

이미지를 인식하기 전에 사전 처리

전체 이미지 또는 선택한 영역만 처리

회전, 왜곡 및 노이즈가 있는 이미지 지원

폴더 또는 아카이브에 있는 모든 이미지의 일괄 인식

웹 링크로 제공되는 이미지 인식

철자가 틀린 단어를 찾아 자동으로 수정합니다.

인식 결과를 JSON으로 가져오기

사용하기 쉬운

아직도 C++ OCR이 어렵다고 생각하시나요? 우리 라이브러리를 사용하면 이미지를 인식하고 결과를 표시하는 데 5 줄의 코드만 있으면 됩니다. 이 코드를 시도하고 직접 확인하십시오.

5줄의 이미지를 텍스트로 - C++

// 이미지 경로 제공
std::string image_path = "../Data/Source/sample.png";

// 결과에 대한 버퍼 준비
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 마법을 걸어
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// 인식 결과 표시
std::wcout << buffer << L"\n";

26개의 인식 언어

OCR API는 혼합 언어의 텍스트를 포함하여 많은 수의 언어와 모든 인기 있는 쓰기 스크립트를 인식할 수 있습니다.

확장 라틴 알파벳 : 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어, 에스토니아어, 핀란드어, 프랑스어, 독일어, 이탈리아어, 라트비아어, 리투아니아어, 노르웨이어, 폴란드어, 포르투갈어, 루마니아어, 슬로바키아어, 슬로베니아어, 스페인어, 스웨덴어.
키릴 문자 : 벨로루시어, 불가리아어, 카자흐어, 러시아어, 세르비아어, 우크라이나어.
중국어 : 6,000자 이상.

언어 감지를 라이브러리에 맡기거나 언어를 직접 정의하여 인식 성능과 안정성을 높일 수 있습니다.

일괄 처리

OCR API는 한 번의 호출로 여러 이미지를 인식할 수 있는 다양한 일괄 처리 방법을 제공하여 모든 이미지를 하나씩 인식할 필요가 없습니다.

다중 페이지 PDF 및 TIFF 파일 인식.
폴더의 모든 파일 인식.
아카이브의 모든 파일 인식.

ZIP 아카이브 인식 - C++

// 아카이브 경로 제공
std::string archive_path = "book.zip";

// 결과에 대한 버퍼 준비
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 기본값으로 RecognitionSettings 개체 초기화
RecognitionSettings settings;

// 인정하다
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

서식 유지

OCR 라이브러리는 Arial, Times New Roman, Courier New, Tahoma, Calibri 등과 같은 모든 인기 있는 서체를 일반, 굵게 및 기울임꼴 스타일로 읽고 OCR 결과의 형식을 신중하게 보존합니다. 인식 결과를 줄로 분할하고 페이지에서 텍스트 영역을 감지할 수도 있습니다.

사진 인식

OCR 응용 프로그램의 광범위한 채택은 일반적으로 대부분의 사용자에게 스캐너가 흔하지 않다는 사실로 인해 중단됩니다. 우리의 OCR 라이브러리에는 어둡고, 회전하고, 기울어지고, 노이즈가 많은 이미지를 처리할 수 있는 강력한 내장 이미지 사전 처리 필터가 있습니다. 모든 이미지 형식에 대한 지원과 함께 스마트폰 사진도 안정적으로 인식할 수 있습니다. 대부분의 전처리 및 이미지 보정이 자동으로 이루어지므로 어려운 경우에만 개입하면 됩니다.

기울기 보정을 위한 사용자 지정 각도 설정 - C++

// 원본 이미지
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// 결과에 대한 버퍼 준비
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// 기울기 각도 조정
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// 이미지 인식
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

맞춤법 검사

OCR은 신뢰할 수 있는 결과를 생성하지만 먼지 및 인쇄 결함으로 인해 일부 기호가 잘못 인식될 수 있습니다. OCR API에는 맞춤법이 틀린 단어를 자동으로 대체하는 맞춤법 검사기가 내장되어 있어 인식 결과를 수동으로 수정할 필요가 없습니다.

Support and Learning Resources

왜 Aspose.OCR for C++인가?
고객 목록
성공 사례

Download Free Trial Pricing Information

Aspose는 다른 인기 있는 프로그래밍 언어에 대한 기본 OCR API도 제공합니다.

C++에서 이미지와 PDF를 텍스트로 변환

몇 줄의 코드로 C++ 애플리케이션에 광학 문자 인식(OCR)을 추가하십시오.

Aspose.OCR for C++

Overview

한눈에

플랫폼 독립성

지원되는 파일 형식

고급 C++ OCR API 기능

사용하기 쉬운

5줄의 이미지를 텍스트로 - C++

26개의 인식 언어

일괄 처리

ZIP 아카이브 인식 - C++

서식 유지

사진 인식

기울기 보정을 위한 사용자 지정 각도 설정 - C++

맞춤법 검사

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava