HTML JPG OCR XML BMP
Aspose.OCR  untuk Java
DOC

Aspose.Imaging for Java

memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format TIFF dan membuat dokumen TIFF yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu mendapatkan Aspose.OCR

Maven atau tentukan konfigurasi Aspose Maven Repository dan instal dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut ke pom.xml. Untuk contoh Graddle, Ivy, Sbt, lihat repositori kami.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Dengan Java OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar TIFF menjadi dokumen DOC:

  • Buat turunan dari kelas AsposeOcr
  • Panggil metode AsposeOCR.RecognizePage
  • Lewati jalur file TIFF sebagai parameter
  • AsposeOCR.RecognizePage mengembalikan String atau file tipe DOC

Persyaratan sistem

Sebelum menjalankan contoh, pastikan Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) atau yang lebih baru telah diinstal pada sistem Anda.

  • JDK 1.6 atau lebih tinggi diinstal.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • TIFF Apa TIFF Format Berkas

    TIFF atau TIF, Tagged Image File Format, mewakili gambar raster yang dimaksudkan untuk digunakan pada berbagai perangkat yang memenuhi standar format file ini. Ia mampu menggambarkan data gambar bilevel, grayscale, palette-color dan full-color dalam beberapa ruang warna. Ini mendukung skema kompresi lossy serta lossless untuk memilih antara ruang dan waktu untuk aplikasi yang menggunakan format. Formatnya dapat diperluas dan telah mengalami beberapa revisi yang memungkinkan dimasukkannya informasi pribadi atau tujuan khusus dalam jumlah yang tidak terbatas. Formatnya tidak bergantung pada mesin dan bebas dari batasan seperti prosesor, sistem operasi, atau sistem file.

    Baca selengkapnya

    DOC Apa DOC Format Berkas

    File dengan ekstensi .doc mewakili dokumen yang dihasilkan oleh Microsoft Word atau dokumen pengolah kata lainnya dalam format file biner. Ekstensi awalnya digunakan untuk dokumentasi teks biasa pada beberapa sistem operasi yang berbeda. Ini dapat berisi beberapa jenis data yang berbeda seperti gambar, diformat serta teks biasa, grafik, bagan, objek yang disematkan, tautan, halaman, pemformatan halaman, pengaturan cetak, dan banyak lainnya. Format ini populer untuk semua jenis dokumentasi karena berbagai opsi yang ditawarkannya kepada pengguna untuk menulis manual, proposal, spesifikasi, resume, artikel, atau dokumen serupa lainnya. Versi terbaru DOC adalah DOCX yang didasarkan pada Office OpenXML yang spesifikasinya tersedia secara terbuka.

    Baca selengkapnya

    TXT (File Dokumen Teks)
    Text (File Dokumen Teks)
    DOC (Dokumen yang dihasilkan oleh Microsoft Word)
    DOCX (dokumen Microsoft Word)
    XLS (Format File Biner Microsoft Excel)
    XLSX (dokumen Microsoft Excel)
    PDF (Format Dokumen Portabel (PDF))
    Searchable PDF (Grafik Jaringan Portabel yang Dapat Dicari)
    XML (Bahasa Markup yang Dapat Diperluas)
    JSON (Notasi Objek JavaScript)