Aspose.OCR  for Java

Ubah gambar dan PDF menjadi teks di Java

Membuat aplikasi Java lintas platform dengan mudah dengan kemampuan optical character recognition (OCR).

  Download Free Trial
  
 

Aspose.OCR untuk Java memungkinkan Anda mengekstrak teks dari gambar, tangkapan layar, area tertentu dari suatu gambar, dan membuat PDF yang dapat dicari dari file yang dipindai pada platform apa pun yang mendukung Java. Dengan API yang kuat namun mudah digunakan, bahkan tugas OCR yang kompleks membutuhkan kurang dari 10 baris kode. Anda tidak perlu bekerja dengan rumus dan pembelajaran mesin - perpustakaan akan menangani semua detail teknis dan menghasilkan hasil yang andal dalam 26 bahasa berdasarkan skrip Latin dan Sirilik , serta bahasa Cina . OCR API memproses gambar yang dipindai, foto ponsel cerdas, tangkapan layar, area gambar, dan PDF yang dipindai dan mengembalikan hasil dalam format dokumen paling populer. Kecepatan pengenalan, akurasi, dan kinerja dapat lebih ditingkatkan dengan mendistribusikan komputasi di beberapa inti CPU dan memindahkan tugas yang membutuhkan banyak sumber daya ke GPU .

Fitur dan Kemampuan Aspose.OCR untuk Java

Mengenali teks yang diformat dalam gambar yang dipindai dan PDF

Mendukung semua format file yang bisa Anda dapatkan dari pemindai atau kamera

Membaca skrip Latin dan Cyrillic

Mengenali lebih dari 6.000 karakter Cina

Mendeteksi dan mengenali semua tipografi populer

Dengan hati-hati mempertahankan gaya dan pemformatan font

Memproses seluruh gambar atau area yang dipilih saja

Mendukung gambar yang diputar, miring, dan berisik

Pengenalan batch semua gambar dalam folder atau arsip

Mengenali gambar yang disediakan sebagai tautan web

Menemukan dan secara otomatis mengoreksi kata-kata yang salah eja

Kompatibilitas 100% dengan produk Aspose lainnya

Mudah untuk Menginstal

Anda dapat menggunakan Aspose.OCR untuk Java langsung dari proyek berbasis Maven dengan mengikuti petunjuk instalasi sederhana.

Minta lisensi sementara untuk mulai membangun aplikasi OCR yang berfungsi penuh tanpa batasan dan batasan apa pun.

$Easy to Use$

Pengenalan gambar membutuhkan beberapa baris kode. Secara harfiah. Ini sangat sederhana - coba sendiri:

Gambar ke teks dalam 7 baris - Java

// Buat instance OCR API
AsposeOCR api = new AsposeOCR();

try {
    // Kenali gambar
    String result = api.RecognizePage(imagePath);
    // Tampilkan hasil pengenalan
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // Penanganan kesalahan
    e.printStackTrace();
}

26 Bahasa Pengenalan

OCR API mendukung banyak bahasa dan semua skrip penulisan populer, termasuk teks dengan bahasa campuran. Pemeriksa ejaan internal secara otomatis mengganti kata-kata yang salah eja dan menyelamatkan Anda dari kesulitan mengoreksi hasil pengenalan secara manual.

  • Alfabet Latin yang Diperpanjang : Kroasia, Ceko, Denmark, Belanda, Inggris, Estonia, Finlandia, Prancis, Jerman, Italia, Latvia, Lituania, Norwegia, Polandia, Portugis, Rumania, Slovakia, Slovenia, Spanyol, Swedia.
  • Alfabet Sirilik : Belarusia, Bulgaria, Kazakh, Rusia, Serbia, Ukraina.
  • Cina : lebih dari 6.000 karakter.

Anda dapat menentukan bahasa untuk meningkatkan kinerja dan keandalan pengenalan atau membiarkan API mendeteksi bahasa secara otomatis.

Pertahankan Pemformatan

OCR API membaca semua tipografi populer seperti Arial, Times New Roman, Courier New, Tahoma, Calibri, dan lainnya dalam gaya reguler, tebal, dan miring, serta dengan hati-hati mempertahankan pemformatan dalam hasil OCR. Anda juga dapat membagi hasil pengenalan menjadi garis dan mendeteksi area teks di halaman.

Kenali Foto

Pemindai tidak selalu tersedia di stasiun kerja pengguna akhir, yang mungkin menjadi penghalang bagi aplikasi OCR. OCR API kami menyediakan sejumlah filter pra-pemrosesan yang dapat menangani gambar yang terdistorsi, diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, memungkinkan pengenalan yang andal bahkan untuk foto smartphone. Sebagian besar pra-pemrosesan dan koreksi gambar dilakukan secara otomatis, tetapi Anda selalu dapat melakukan intervensi dalam kasus-kasus sulit.

Terapkan koreksi gambar - Java

// Buat instance OCR API
AsposeOCR api = new AsposeOCR();

// Tentukan filter pra-pemrosesan
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Gambar pra-proses sebelum dikenali
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Kenali gambar
RecognitionResult result = api.RecognizePage(imageRes, set);

Optimasi Kinerja

Pengenalan karakter optik membutuhkan banyak sumber daya pemrosesan, yang dapat menjadi masalah untuk layanan web dan perangkat tingkat pemula. API menawarkan cara yang sangat fleksibel untuk menyeimbangkan kecepatan pengenalan, persyaratan sumber daya, dan akurasi:

  • Pilih antara pengenalan menyeluruh dan pengenalan cepat.
  • Tentukan jumlah utas yang dialokasikan untuk pengenalan, atau izinkan perpustakaan untuk secara otomatis menskalakan ke jumlah inti CPU.
  • Kosongkan CPU dengan menurunkan perhitungan ke GPU.

Pengenalan cepat - Java

// Buat instance OCR API
AsposeOCR api = new AsposeOCR();

// Kenali gambar dalam mode tercepat
String result = api.RecognizePageFast("sample.jpg");

Pemrosesan Batch

OCR API membebaskan Anda dari keharusan mengenali setiap gambar satu per satu dengan menawarkan berbagai metode pemrosesan batch yang memungkinkan Anda mengenali banyak gambar dalam satu panggilan:

  • Pengenalan file PDF dan TIFF multi-halaman.
  • Pengakuan semua file dalam arsip.
  • Pengenalan semua file dalam folder.
  
  
  

Aspose juga menawarkan API OCR asli untuk bahasa pemrograman populer lainnya: