HTML JPG OCR XML BMP
Aspose.OCR  untuk Java
Text

Aspose.Imaging for Java

memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format JPEG dan membuat dokumen JPEG yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR

Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dengan Java OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar JPEG menjadi dokumen Text:

  • Buat turunan dari kelas AsposeOcr
  • Panggil metode AsposeOCR.RecognizePage
  • Lewati jalur file JPEG sebagai parameter
  • AsposeOCR.RecognizePage mengembalikan String atau file tipe Text

Persyaratan sistem

Sebelum menjalankan contoh, pastikan Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) atau yang lebih baru telah diinstal pada sistem Anda.

  • JDK 1.6 atau lebih tinggi diinstal.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPEG Apa JPEG Format Berkas

    JPEG adalah jenis format gambar yang disimpan menggunakan metode kompresi lossy. Gambar keluaran, sebagai hasil kompresi, merupakan pertukaran antara ukuran penyimpanan dan kualitas gambar. Pengguna dapat menyesuaikan tingkat kompresi untuk mencapai tingkat kualitas yang diinginkan sekaligus mengurangi ukuran penyimpanan. Kualitas gambar tidak terlalu terpengaruh jika kompresi 10:1 diterapkan pada gambar. Semakin tinggi nilai kompresi, semakin tinggi penurunan kualitas gambar.

    Baca selengkapnya

    Text Apa Text Format Berkas

    File dengan ekstensi .TXT mewakili dokumen teks yang berisi teks biasa dalam bentuk garis. Paragraf dalam dokumen teks dikenali oleh carriage return dan digunakan untuk pengaturan konten file yang lebih baik. Dokumen teks standar dapat dibuka di editor teks atau aplikasi pengolah kata apa pun pada sistem operasi yang berbeda. Semua teks yang terkandung dalam file tersebut dalam format yang dapat dibaca manusia dan diwakili oleh urutan karakter.

    Baca selengkapnya

    TXT (File Dokumen Teks)
    Text (File Dokumen Teks)
    DOC (Dokumen yang dihasilkan oleh Microsoft Word)
    DOCX (dokumen Microsoft Word)
    XLS (Format File Biner Microsoft Excel)
    XLSX (dokumen Microsoft Excel)
    PDF (Format Dokumen Portabel (PDF))
    Searchable PDF (Grafik Jaringan Portabel yang Dapat Dicari)
    XML (Bahasa Markup yang Dapat Diperluas)
    JSON (Notasi Objek JavaScript)