taranan görüntüleri ve hatta akıllı telefon fotoğraflarını PDF biçiminde işler ve tanınan metin içeren PDF belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.
Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Java OCR ve yalnızca birkaç satır kod ile, bir PDF görüntüsünü TXT belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:
- AsposeOcr sınıfının bir örneğini oluşturun
- AsposeOCR.RecognizePage yöntemini çağırın
- PDF dosya yolunu parametre olarak iletin
- AsposeOCR.RecognizePage, TXT türünde bir String veya dosya döndürür
sistem gereksinimleri
Örneği çalıştırmadan önce, sisteminizde Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) veya sonraki sürümünün kurulu olduğundan emin olun.
- JDK 1.6 veya üstü yüklü.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
PDF Nedir PDF Dosya formatı
Taşınabilir Belge Formatı (PDF), Adobe tarafından 1990'larda oluşturulmuş bir belge türüdür. Bu dosya biçiminin amacı, belgelerin ve diğer başvuru malzemelerinin uygulama yazılımı, donanım ve İşletim Sisteminden bağımsız bir biçimde temsil edilmesi için bir standart getirmekti. PDF dosya formatı, kaynak belgenin bir parçası haline gelebilecek metin, resimler, köprüler, form alanları, zengin medya, dijital imzalar, ekler, meta veriler, Jeo-uzaysal özellikler ve 3B nesneler gibi bilgileri içerme konusunda tam kapasiteye sahiptir.
Devamını okuTXT Nedir TXT Dosya formatı
.TXT uzantılı bir dosya, satırlar şeklinde düz metin içeren bir metin belgesini temsil eder. Bir metin belgesindeki paragraflar satır başlarıyla tanınır ve dosya içeriğinin daha iyi düzenlenmesi için kullanılır. Standart bir metin belgesi, farklı işletim sistemlerindeki herhangi bir metin düzenleyicide veya kelime işlemci uygulamasında açılabilir. Böyle bir dosyada bulunan tüm metinler insan tarafından okunabilir biçimdedir ve karakter dizisiyle temsil edilir.
Devamını oku