HTML JPG OCR XML BMP
Aspose.OCR  untuk Java
Searchable PDF

Aspose.Imaging for Java

memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format WBMP dan membuat dokumen WBMP yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR

Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dengan Java OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar WBMP menjadi dokumen Searchable PDF:

  • Buat turunan dari kelas AsposeOcr
  • Panggil metode AsposeOCR.RecognizePage
  • Lewati jalur file WBMP sebagai parameter
  • AsposeOCR.RecognizePage mengembalikan String atau file tipe Searchable PDF

Persyaratan sistem

Sebelum menjalankan contoh, pastikan Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) atau yang lebih baru telah diinstal pada sistem Anda.

  • JDK 1.6 atau lebih tinggi diinstal.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • WBMP Apa WBMP Format Berkas

    WBMP adalah format file grafik monokrom yang dioptimalkan untuk perangkat komputasi seluler. Gambar WBMP bersifat monokrom (hitam & putih) sehingga ukuran gambar dijaga seminimal mungkin. Piksel hitam dilambangkan dengan 0 dan piksel putih dilambangkan dengan 1.

    Baca selengkapnya

    Searchable PDF Apa Searchable PDF Format Berkas

    File PDF yang dapat dicari mempertahankan gambar pindaian asli untuk dilihat, serta teks OCR dalam lapisan tersembunyi yang dapat digunakan untuk pencarian teks lengkap dalam dokumen atau menyorot teks untuk operasi salin dan tempel. Konversi OCR penuh ke PDF, tidak termasuk gambar asli, tidak akan pernah mempertahankan 100% format aslinya, terutama jika dokumen memiliki banyak gambar atau tata letak yang rumit.

    Baca selengkapnya

    TXT (File Dokumen Teks)
    Text (File Dokumen Teks)
    DOC (Dokumen yang dihasilkan oleh Microsoft Word)
    DOCX (dokumen Microsoft Word)
    XLS (Format File Biner Microsoft Excel)
    XLSX (dokumen Microsoft Excel)
    PDF (Format Dokumen Portabel (PDF))
    Searchable PDF (Grafik Jaringan Portabel yang Dapat Dicari)
    XML (Bahasa Markup yang Dapat Diperluas)
    JSON (Notasi Objek JavaScript)