memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format PDF dan membuat dokumen PDF yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR
Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Dengan Java OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar PDF menjadi dokumen XLSX:
- Buat turunan dari kelas AsposeOcr
- Panggil metode AsposeOCR.RecognizePage
- Lewati jalur file PDF sebagai parameter
- AsposeOCR.RecognizePage mengembalikan String atau file tipe XLSX
Persyaratan sistem
Sebelum menjalankan contoh, pastikan Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) atau yang lebih baru telah diinstal pada sistem Anda.
- JDK 1.6 atau lebih tinggi diinstal.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
PDF Apa PDF Format Berkas
Portable Document Format (PDF) adalah jenis dokumen yang dibuat oleh Adobe pada tahun 1990-an. Tujuan dari format file ini adalah untuk memperkenalkan standar representasi dokumen dan bahan referensi lainnya dalam format yang independen dari perangkat lunak aplikasi, perangkat keras, serta Sistem Operasi. Format file PDF memiliki kemampuan penuh untuk memuat informasi seperti teks, gambar, hyperlink, form-fields, media kaya, tanda tangan digital, lampiran, metadata, fitur Geospasial dan objek 3D di dalamnya yang dapat menjadi bagian dari dokumen sumber.
Baca selengkapnyaXLSX Apa XLSX Format Berkas
XLSX adalah format terkenal untuk dokumen Microsoft Excel yang diperkenalkan oleh Microsoft dengan dirilisnya Microsoft Office 2007. Berdasarkan struktur yang diatur menurut Konvensi Pembungkus Terbuka sebagaimana diuraikan dalam Bagian 2 dari standar OOXML ECMA-376, format barunya adalah paket zip yang berisi sejumlah file XML. Struktur dan file yang mendasarinya dapat diperiksa hanya dengan membuka ritsleting file .xlsx.
Baca selengkapnya