HTML JPG OCR XML BMP

Searchable PDF

taranan görüntüleri ve hatta akıllı telefon fotoğraflarını PDF biçiminde işler ve tanınan metin içeren PDF belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.

Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.

Maven Dependency
 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCR ve yalnızca birkaç satır kod ile, bir PDF görüntüsünü Searchable PDF belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:

AsposeOcr sınıfının bir örneğini oluşturun
AsposeOCR.RecognizePage yöntemini çağırın
PDF dosya yolunu parametre olarak iletin
AsposeOCR.RecognizePage, Searchable PDF türünde bir String veya dosya döndürür

sistem gereksinimleri

Örneği çalıştırmadan önce, sisteminizde Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) veya sonraki sürümünün kurulu olduğundan emin olun.

JDK 1.6 veya üstü yüklü.

 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);

PDF Nedir PDF Dosya formatı

Taşınabilir Belge Formatı (PDF), Adobe tarafından 1990'larda oluşturulmuş bir belge türüdür. Bu dosya biçiminin amacı, belgelerin ve diğer başvuru malzemelerinin uygulama yazılımı, donanım ve İşletim Sisteminden bağımsız bir biçimde temsil edilmesi için bir standart getirmekti. PDF dosya formatı, kaynak belgenin bir parçası haline gelebilecek metin, resimler, köprüler, form alanları, zengin medya, dijital imzalar, ekler, meta veriler, Jeo-uzaysal özellikler ve 3B nesneler gibi bilgileri içerme konusunda tam kapasiteye sahiptir.

Devamını oku

Searchable PDF Nedir Searchable PDF Dosya formatı

Aranabilir PDF dosyaları, orijinal taranmış görüntüyü ve ayrıca bir belge içinde tam metin aramaları veya kopyalama ve yapıştırma işlemleri için metni vurgulama için kullanılabilen gizli bir katmandaki OCR metnini korur. Orijinal görüntüyü içermeyen PDF'ye tam OCR dönüştürme, özellikle belgede çok sayıda görüntü veya karmaşık bir düzen varsa, orijinal biçimlendirmenin %100'ünü asla korumaz.

Devamını oku

TXT (Metin Belgesi Dosyası)

Text (Metin Belgesi Dosyası)

DOC (Microsoft Word tarafından oluşturulan belgeler)

DOCX (Microsoft Word belgeleri)

XLS (Microsoft Excel İkili Dosya Biçimi)

XLSX (Microsoft Excel belgeleri)

PDF (Taşınabilir Belge Formatı (PDF))

Searchable PDF (Aranabilir Taşınabilir Ağ Grafikleri)

XML (Genişletilebilir İşaretleme Dili)

JSON (JavaScript Nesnesi Gösterimi)

Aspose.OCR Java için

Overview

Maven Dependency

sistem gereksinimleri

PDF Nedir PDF Dosya formatı

Searchable PDF Nedir Searchable PDF Dosya formatı