taranan görüntüleri ve hatta akıllı telefon fotoğraflarını DJVU biçiminde işler ve tanınan metin içeren DJVU belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.
Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Java OCR ve yalnızca birkaç satır kod ile, bir DJVU görüntüsünü DOC belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:
- AsposeOcr sınıfının bir örneğini oluşturun
- AsposeOCR.RecognizePage yöntemini çağırın
- DJVU dosya yolunu parametre olarak iletin
- AsposeOCR.RecognizePage, DOC türünde bir String veya dosya döndürür
sistem gereksinimleri
Örneği çalıştırmadan önce, sisteminizde Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) veya sonraki sürümünün kurulu olduğundan emin olun.
- JDK 1.6 veya üstü yüklü.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
DJVU Nedir DJVU Dosya formatı
DjVu, “déjà vu” olarak telaffuz edilir, özellikle metin, çizim, resim ve fotoğrafların birleşimini içeren taranmış belgeler ve kitaplar için tasarlanmış bir grafik dosya formatıdır. AT&T Labs tarafından geliştirilmiştir. Metin ve arka plan görüntülerinin görüntü katmanı ayrımı, aşamalı yükleme, aritmetik kodlama ve iki tonlu görüntüler için kayıplı sıkıştırma gibi birden çok teknik kullanır. DJVU dosyası sıkıştırılmış ancak yüksek kaliteli renkli görüntüler, fotoğraflar, metinler ve çizimler içerebildiğinden ve daha az alana kaydedilebildiğinden, web'de e-Kitaplar, kılavuzlar, gazeteler, eski belgeler vb. olarak kullanılır.
Devamını okuDOC Nedir DOC Dosya formatı
.doc uzantılı dosyalar, Microsoft Word veya diğer kelime işlem belgeleri tarafından ikili dosya biçiminde oluşturulan belgeleri temsil eder. Uzantı başlangıçta birkaç farklı işletim sisteminde düz metin belgeleri için kullanıldı. Düz metin, grafikler, çizelgeler, gömülü nesneler, bağlantılar, sayfalar, sayfa biçimlendirme, yazdırma ayarları ve daha pek çok biçimin yanı sıra biçimlendirilmiş görüntüler gibi birkaç farklı veri türü içerebilir. Bu format, kullanıcılara kılavuzlar, teklifler, şartnameler, özgeçmişler, makaleler veya benzeri belgeler yazmak için sunduğu çeşitli seçenekler nedeniyle her türlü belge için popülerdi. DOC'nin güncellenmiş sürümü, özellikleri açık olan Office OpenXML tabanlı DOCX'tir.
Devamını oku