taranan görüntüleri ve hatta akıllı telefon fotoğraflarını TIF biçiminde işler ve tanınan metin içeren TIF belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.
Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Java OCR ve yalnızca birkaç satır kod ile, bir TIF görüntüsünü DOCX belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:
- AsposeOcr sınıfının bir örneğini oluşturun
- AsposeOCR.RecognizePage yöntemini çağırın
- TIF dosya yolunu parametre olarak iletin
- AsposeOCR.RecognizePage, DOCX türünde bir String veya dosya döndürür
sistem gereksinimleri
Örneği çalıştırmadan önce, sisteminizde Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) veya sonraki sürümünün kurulu olduğundan emin olun.
- JDK 1.6 veya üstü yüklü.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
TIF Nedir TIF Dosya formatı
TIFF veya TIF, Etiketli Görüntü Dosyası Biçimi, bu dosya biçimi standardına uyan çeşitli aygıtlarda kullanılması amaçlanan taramalı görüntüleri temsil eder. Çeşitli renk uzaylarında çift düzeyli, gri tonlamalı, palet renkli ve tam renkli görüntü verilerini tanımlama yeteneğine sahiptir. Formatı kullanan uygulamalar için alan ve zaman arasında seçim yapmak için kayıplı ve kayıpsız sıkıştırma şemalarını destekler. Format genişletilebilir ve sınırsız miktarda özel veya özel amaçlı bilginin dahil edilmesine izin veren birkaç revizyondan geçmiştir. Biçim makineye bağımlı değildir ve işlemci, işletim sistemi veya dosya sistemleri gibi sınırlardan muaftır.
Devamını okuDOCX Nedir DOCX Dosya formatı
DOCX, Microsoft Word belgeleri için iyi bilinen bir formattır. 2007'den itibaren Microsoft Office 2007'nin piyasaya sürülmesiyle tanıtılan bu yeni Belge biçiminin yapısı, düz ikili dosyadan XML ve ikili dosyaların bir kombinasyonuna değiştirildi. Docx dosyaları, Word 2007 ve yan sürümleriyle açılabilir, ancak MS Word'ün DOC dosya uzantılarını destekleyen önceki sürümleriyle açılamaz.
Devamını oku