Ubah gambar dan PDF menjadi teks di Java
Membuat aplikasi Java lintas platform dengan mudah dengan kemampuan optical character recognition (OCR).
Download Free TrialAspose.OCR untuk Java memungkinkan Anda mengekstrak teks dari gambar, tangkapan layar, area tertentu dari suatu gambar, dan membuat PDF yang dapat dicari dari file yang dipindai pada platform apa pun yang mendukung Java. Dengan API yang kuat namun mudah digunakan, bahkan tugas OCR yang kompleks membutuhkan kurang dari 10 baris kode. Anda tidak perlu bekerja dengan rumus dan pembelajaran mesin - perpustakaan akan menangani semua detail teknis dan menghasilkan hasil yang andal dalam 26 bahasa berdasarkan skrip Latin dan Sirilik , serta bahasa Cina . OCR API memproses gambar yang dipindai, foto ponsel cerdas, tangkapan layar, area gambar, dan PDF yang dipindai dan mengembalikan hasil dalam format dokumen paling populer. Kecepatan pengenalan, akurasi, dan kinerja dapat lebih ditingkatkan dengan mendistribusikan komputasi di beberapa inti CPU dan memindahkan tugas yang membutuhkan banyak sumber daya ke GPU .
Fitur dan Kemampuan Aspose.OCR untuk Java
Mengenali teks yang diformat dalam gambar yang dipindai dan PDF
Mendukung semua format file yang bisa Anda dapatkan dari pemindai atau kamera
Membaca skrip Latin dan Cyrillic
Mengenali lebih dari 6.000 karakter Cina
Mendeteksi dan mengenali semua tipografi populer
Dengan hati-hati mempertahankan gaya dan pemformatan font
Memproses seluruh gambar atau area yang dipilih saja
Mendukung gambar yang diputar, miring, dan berisik
Pengenalan batch semua gambar dalam folder atau arsip
Mengenali gambar yang disediakan sebagai tautan web
Menemukan dan secara otomatis mengoreksi kata-kata yang salah eja
Kompatibilitas 100% dengan produk Aspose lainnya
Mudah untuk Menginstal
Anda dapat menggunakan Aspose.OCR untuk Java langsung dari proyek berbasis Maven dengan mengikuti petunjuk instalasi sederhana.
Minta lisensi sementara untuk mulai membangun aplikasi OCR yang berfungsi penuh tanpa batasan dan batasan apa pun.
$Easy to Use$
Pengenalan gambar membutuhkan beberapa baris kode. Secara harfiah. Ini sangat sederhana - coba sendiri:
Gambar ke teks dalam 7 baris - Java
// Buat instance OCR API
AsposeOCR api = new AsposeOCR();
try {
// Kenali gambar
String result = api.RecognizePage(imagePath);
// Tampilkan hasil pengenalan
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// Penanganan kesalahan
e.printStackTrace();
}
26 Bahasa Pengenalan
OCR API mendukung banyak bahasa dan semua skrip penulisan populer, termasuk teks dengan bahasa campuran. Pemeriksa ejaan internal secara otomatis mengganti kata-kata yang salah eja dan menyelamatkan Anda dari kesulitan mengoreksi hasil pengenalan secara manual.
- Alfabet Latin yang Diperpanjang : Kroasia, Ceko, Denmark, Belanda, Inggris, Estonia, Finlandia, Prancis, Jerman, Italia, Latvia, Lituania, Norwegia, Polandia, Portugis, Rumania, Slovakia, Slovenia, Spanyol, Swedia.
- Alfabet Sirilik : Belarusia, Bulgaria, Kazakh, Rusia, Serbia, Ukraina.
- Cina : lebih dari 6.000 karakter.
Anda dapat menentukan bahasa untuk meningkatkan kinerja dan keandalan pengenalan atau membiarkan API mendeteksi bahasa secara otomatis.
Pertahankan Pemformatan
OCR API membaca semua tipografi populer seperti Arial, Times New Roman, Courier New, Tahoma, Calibri, dan lainnya dalam gaya reguler, tebal, dan miring, serta dengan hati-hati mempertahankan pemformatan dalam hasil OCR. Anda juga dapat membagi hasil pengenalan menjadi garis dan mendeteksi area teks di halaman.
Kenali Foto
Pemindai tidak selalu tersedia di stasiun kerja pengguna akhir, yang mungkin menjadi penghalang bagi aplikasi OCR. OCR API kami menyediakan sejumlah filter pra-pemrosesan yang dapat menangani gambar yang terdistorsi, diputar, miring, dan berisik. Dikombinasikan dengan dukungan untuk semua format gambar, memungkinkan pengenalan yang andal bahkan untuk foto smartphone. Sebagian besar pra-pemrosesan dan koreksi gambar dilakukan secara otomatis, tetapi Anda selalu dapat melakukan intervensi dalam kasus-kasus sulit.
Terapkan koreksi gambar - Java
// Buat instance OCR API
AsposeOCR api = new AsposeOCR();
// Tentukan filter pra-pemrosesan
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Gambar pra-proses sebelum dikenali
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Kenali gambar
RecognitionResult result = api.RecognizePage(imageRes, set);
Optimasi Kinerja
Pengenalan karakter optik membutuhkan banyak sumber daya pemrosesan, yang dapat menjadi masalah untuk layanan web dan perangkat tingkat pemula. API menawarkan cara yang sangat fleksibel untuk menyeimbangkan kecepatan pengenalan, persyaratan sumber daya, dan akurasi:
- Pilih antara pengenalan menyeluruh dan pengenalan cepat.
- Tentukan jumlah utas yang dialokasikan untuk pengenalan, atau izinkan perpustakaan untuk secara otomatis menskalakan ke jumlah inti CPU.
- Kosongkan CPU dengan menurunkan perhitungan ke GPU.
Pengenalan cepat - Java
// Buat instance OCR API
AsposeOCR api = new AsposeOCR();
// Kenali gambar dalam mode tercepat
String result = api.RecognizePageFast("sample.jpg");
Pemrosesan Batch
OCR API membebaskan Anda dari keharusan mengenali setiap gambar satu per satu dengan menawarkan berbagai metode pemrosesan batch yang memungkinkan Anda mengenali banyak gambar dalam satu panggilan:
- Pengenalan file PDF dan TIFF multi-halaman.
- Pengakuan semua file dalam arsip.
- Pengenalan semua file dalam folder.
Support and Learning Resources
- Sumber Belajar
- Dokumentasi
- Kode sumber
- Referensi API
- Video Tutorial
- Dukungan Produk
- Dukungan Gratis
- Dukungan Berbayar
- Blog
- Catatan Rilis
- Mengapa Aspose.OCR untuk Java?
- Daftar Pelanggan
- Cerita-cerita sukses