Aspose.OCR  for C++

Konversi gambar dan PDF ke teks dalam C++

Tambahkan pengenalan karakter optik (OCR) ke aplikasi C++ Anda dengan beberapa baris kode.

  Download Free Trial
  
 

Aspose.OCR untuk C++ memperluas aplikasi Anda dengan kemampuan pengenalan karakter optik dalam 5 baris kode. Pengalaman kami dalam jaringan saraf dan pembelajaran mesin telah diterjemahkan ke dalam perpustakaan OCR dengan kinerja dan akurasi yang unggul yang mendukung 26 bahasa berdasarkan skrip Latin dan Sirilik serta Cina . OCR API dapat mengenali gambar yang dipindai, foto ponsel cerdas, tangkapan layar, area gambar, dan PDF yang dipindai dan mengembalikan hasil dalam format dokumen dan pertukaran data yang paling populer. Ini benar-benar offline dan tidak memerlukan koneksi internet untuk bekerja. API membutuhkan sedikit upaya untuk memulai dan kurva pembelajaran yang dangkal untuk dikuasai. Semua pra-pemrosesan, koreksi kemiringan, penghilangan noise, deteksi bahasa, multi-threading, dan tugas kompleks lainnya dilakukan secara otomatis, tetapi dapat disetel untuk menangani kasus yang sulit.

Fitur C++ OCR API Tingkat Lanjut

Mengekstrak teks dari gambar dan membuat PDF yang dapat dicari

Mendukung gambar apa pun yang bisa Anda dapatkan dari pemindai atau kamera

Membaca skrip Latin dan Sirilik yang Diperpanjang

Mengenali lebih dari 6.000 karakter Cina

Mendeteksi dan mengenali semua tipografi dan pemformatan populer

Pra-proses gambar sebelum dikenali

Memproses seluruh gambar atau area yang dipilih saja

Mendukung gambar yang diputar, miring, dan berisik

Pengenalan batch semua gambar dalam folder atau arsip

Mengenali gambar yang disediakan sebagai tautan web

Menemukan dan secara otomatis mengoreksi kata-kata yang salah eja

Dapatkan hasil pengakuan sebagai JSON

Mudah digunakan

Apakah Anda masih berpikir C++ OCR itu sulit? Dengan library kami, Anda hanya perlu 5 baris kode untuk mengenali gambar dan menampilkan hasilnya. Coba kode ini dan lihat sendiri:

Gambar ke teks dalam 5 baris - C++

// Berikan jalur gambar
std::string image_path = "../Data/Source/sample.png";

// Siapkan buffer untuk hasil
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Lakukan keajaiban
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Tampilkan hasil pengenalan
std::wcout << buffer << L"\n";

26 Bahasa Pengenalan

OCR API dapat mengenali banyak bahasa dan semua skrip penulisan populer, termasuk teks dengan bahasa campuran.

  • Alfabet Latin yang Diperpanjang : Kroasia, Ceko, Denmark, Belanda, Inggris, Estonia, Finlandia, Prancis, Jerman, Italia, Latvia, Lituania, Norwegia, Polandia, Portugis, Rumania, Slovakia, Slovenia, Spanyol, Swedia.
  • Alfabet Sirilik : Belarusia, Bulgaria, Kazakh, Rusia, Serbia, Ukraina.
  • Cina : lebih dari 6.000 karakter.

Anda dapat menyerahkan deteksi bahasa ke perpustakaan atau menentukan bahasa sendiri untuk meningkatkan kinerja dan keandalan pengenalan.

Pemrosesan Batch

OCR API membebaskan Anda dari mengenali setiap gambar satu per satu dengan menawarkan berbagai metode pemrosesan batch yang memungkinkan Anda mengenali banyak gambar dalam satu panggilan:

  • Pengenalan file PDF dan TIFF multi-halaman.
  • Pengenalan semua file dalam folder.
  • Pengakuan semua file dalam arsip.

Kenali arsip ZIP - C++

// Menyediakan jalur arsip
std::string archive_path = "book.zip";

// Siapkan buffer untuk hasil
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Inisialisasi objek RecognitionSettings dengan nilai default
RecognitionSettings settings;

// Mengenali
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Pertahankan Pemformatan

Pustaka OCR membaca semua tipografi populer seperti Arial, Times New Roman, Courier New, Tahoma, Calibri, dan lainnya dalam gaya reguler, tebal, dan miring, serta dengan hati-hati mempertahankan pemformatan dalam hasil OCR. Anda juga dapat membagi hasil pengenalan menjadi garis dan mendeteksi area teks di halaman.

Kenali Foto

Adopsi aplikasi OCR yang meluas biasanya dihentikan oleh fakta bahwa pemindai tidak biasa bagi sebagian besar pengguna. Pustaka OCR kami memiliki filter pra-pemrosesan gambar bawaan yang kuat yang dapat menangani gambar gelap, diputar, miring, dan bising. Dikombinasikan dengan dukungan untuk semua format gambar, memungkinkan pengenalan yang andal bahkan untuk foto smartphone. Sebagian besar pra-pemrosesan dan koreksi gambar dilakukan secara otomatis, jadi Anda hanya perlu campur tangan dalam kasus-kasus sulit.

Tetapkan sudut khusus untuk koreksi kemiringan - C++

// Gambar asli
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Siapkan buffer untuk hasil
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Sesuaikan sudut kemiringan
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Kenali gambar
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Cek ejaan

Meskipun OCR memberikan hasil yang andal, debu dan cacat cetakan dapat menyebabkan beberapa simbol tidak dikenali dengan benar. OCR API memiliki pemeriksa ejaan bawaan yang secara otomatis mengganti kata yang salah eja dan membebaskan Anda dari keharusan mengoreksi hasil pengenalan secara manual.

  
  
  

Aspose juga menawarkan API OCR asli untuk bahasa pemrograman populer lainnya: