HTML JPG OCR XML BMP
Aspose.OCR  untuk C++
DOCX

Aspose.Imaging for Java

memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format TIF dan membuat dokumen TIF yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR

Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Dengan C++ OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar TIF menjadi dokumen DOCX:

  • Buat turunan dari kelas AsposeOcr
  • Panggil metode AsposeOCR.asposeocr_page()
  • Lewati jalur file TIF sebagai parameter
  • AsposeOCR.asposeocr_page mengembalikan String atau file tipe DOCX

Persyaratan sistem

Sebelum menjalankan contoh, pastikan Microsoft.ML.OnnxRuntime 1.7.0 atau yang lebih baru ditambahkan ke proyek. Itu harus diinstal secara otomatis jika Anda menginstal Aspose.OCR melalui NuGet Package Manager.

  • NET Standard 2.0+ solusi yang kompatibel
  • Aspose.OCR untuk .NET yang dirujuk dalam proyek Anda.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • TIF Apa TIF Format Berkas

    TIFF atau TIF, Tagged Image File Format, mewakili gambar raster yang dimaksudkan untuk digunakan pada berbagai perangkat yang memenuhi standar format file ini. Ia mampu menggambarkan data gambar bilevel, grayscale, palette-color dan full-color dalam beberapa ruang warna. Ini mendukung skema kompresi lossy serta lossless untuk memilih antara ruang dan waktu untuk aplikasi yang menggunakan format. Formatnya dapat diperluas dan telah mengalami beberapa revisi yang memungkinkan dimasukkannya informasi pribadi atau tujuan khusus dalam jumlah yang tidak terbatas. Formatnya tidak bergantung pada mesin dan bebas dari batasan seperti prosesor, sistem operasi, atau sistem file.

    Baca selengkapnya

    DOCX Apa DOCX Format Berkas

    DOCX adalah format terkenal untuk dokumen Microsoft Word. Diperkenalkan dari tahun 2007 dengan rilis Microsoft Office 2007, struktur format Dokumen baru ini diubah dari biner biasa menjadi kombinasi file XML dan biner. File Docx dapat dibuka dengan Word 2007 dan versi lateral tetapi tidak dengan versi MS Word sebelumnya yang mendukung ekstensi file DOC.

    Baca selengkapnya

    TXT (File Dokumen Teks)
    Text (File Dokumen Teks)
    DOC (Dokumen yang dihasilkan oleh Microsoft Word)
    DOCX (dokumen Microsoft Word)
    XLS (Format File Biner Microsoft Excel)
    XLSX (dokumen Microsoft Excel)
    PDF (Format Dokumen Portabel (PDF))
    Searchable PDF (Grafik Jaringan Portabel yang Dapat Dicari)