memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format PDF dan membuat dokumen PDF yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR
Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Dengan C++ OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar PDF menjadi dokumen DOC:
- Buat turunan dari kelas AsposeOcr
- Panggil metode AsposeOCR.asposeocr_page()
- Lewati jalur file PDF sebagai parameter
- AsposeOCR.asposeocr_page mengembalikan String atau file tipe DOC
Persyaratan sistem
Sebelum menjalankan contoh, pastikan Microsoft.ML.OnnxRuntime 1.7.0 atau yang lebih baru ditambahkan ke proyek. Itu harus diinstal secara otomatis jika Anda menginstal Aspose.OCR melalui NuGet Package Manager.
- NET Standard 2.0+ solusi yang kompatibel
- Aspose.OCR untuk .NET yang dirujuk dalam proyek Anda.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
PDF Apa PDF Format Berkas
Portable Document Format (PDF) adalah jenis dokumen yang dibuat oleh Adobe pada tahun 1990-an. Tujuan dari format file ini adalah untuk memperkenalkan standar representasi dokumen dan bahan referensi lainnya dalam format yang independen dari perangkat lunak aplikasi, perangkat keras, serta Sistem Operasi. Format file PDF memiliki kemampuan penuh untuk memuat informasi seperti teks, gambar, hyperlink, form-fields, media kaya, tanda tangan digital, lampiran, metadata, fitur Geospasial dan objek 3D di dalamnya yang dapat menjadi bagian dari dokumen sumber.
Baca selengkapnyaDOC Apa DOC Format Berkas
File dengan ekstensi .doc mewakili dokumen yang dihasilkan oleh Microsoft Word atau dokumen pengolah kata lainnya dalam format file biner. Ekstensi awalnya digunakan untuk dokumentasi teks biasa pada beberapa sistem operasi yang berbeda. Ini dapat berisi beberapa jenis data yang berbeda seperti gambar, diformat serta teks biasa, grafik, bagan, objek yang disematkan, tautan, halaman, pemformatan halaman, pengaturan cetak, dan banyak lainnya. Format ini populer untuk semua jenis dokumentasi karena berbagai opsi yang ditawarkannya kepada pengguna untuk menulis manual, proposal, spesifikasi, resume, artikel, atau dokumen serupa lainnya. Versi terbaru DOC adalah DOCX yang didasarkan pada Office OpenXML yang spesifikasinya tersedia secara terbuka.
Baca selengkapnya