HTML JPG OCR XML BMP
Aspose.OCR  untuk C++
Text

Aspose.Imaging for Java

memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format DJVU dan membuat dokumen DJVU yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR

Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Dengan C++ OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar DJVU menjadi dokumen Text:

  • Buat turunan dari kelas AsposeOcr
  • Panggil metode AsposeOCR.asposeocr_page()
  • Lewati jalur file DJVU sebagai parameter
  • AsposeOCR.asposeocr_page mengembalikan String atau file tipe Text

Persyaratan sistem

Sebelum menjalankan contoh, pastikan Microsoft.ML.OnnxRuntime 1.7.0 atau yang lebih baru ditambahkan ke proyek. Itu harus diinstal secara otomatis jika Anda menginstal Aspose.OCR melalui NuGet Package Manager.

  • NET Standard 2.0+ solusi yang kompatibel
  • Aspose.OCR untuk .NET yang dirujuk dalam proyek Anda.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • DJVU Apa DJVU Format Berkas

    DjVu, diucapkan sebagai "déjà vu", adalah format file grafik yang ditujukan untuk dokumen dan buku yang dipindai terutama yang berisi kombinasi teks, gambar, gambar, dan foto. Ini dikembangkan oleh AT&T Labs. Ini menggunakan beberapa teknik seperti pemisahan lapisan gambar teks dan gambar latar belakang, pemuatan progresif, pengkodean aritmatika dan kompresi lossy untuk gambar bitonal. Karena file DJVU dapat berisi gambar, foto, teks, dan gambar berwarna yang terkompresi namun berkualitas tinggi dan dapat disimpan dalam ruang yang lebih sedikit, oleh karena itu, file ini digunakan di web sebagai eBuku, manual, surat kabar, dokumen kuno, dll.

    Baca selengkapnya

    Text Apa Text Format Berkas

    File dengan ekstensi .TXT mewakili dokumen teks yang berisi teks biasa dalam bentuk garis. Paragraf dalam dokumen teks dikenali oleh carriage return dan digunakan untuk pengaturan konten file yang lebih baik. Dokumen teks standar dapat dibuka di editor teks atau aplikasi pengolah kata apa pun pada sistem operasi yang berbeda. Semua teks yang terkandung dalam file tersebut dalam format yang dapat dibaca manusia dan diwakili oleh urutan karakter.

    Baca selengkapnya