HTML JPG OCR XML BMP
Aspose.OCR  Java için
DOC

Aspose.Imaging for Java

taranan görüntüleri ve hatta akıllı telefon fotoğraflarını JPEG2000 biçiminde işler ve tanınan metin içeren JPEG2000 belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.

Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCR ve yalnızca birkaç satır kod ile, bir JPEG2000 görüntüsünü DOC belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:

  • AsposeOcr sınıfının bir örneğini oluşturun
  • AsposeOCR.RecognizePage yöntemini çağırın
  • JPEG2000 dosya yolunu parametre olarak iletin
  • AsposeOCR.RecognizePage, DOC türünde bir String veya dosya döndürür

sistem gereksinimleri

Örneği çalıştırmadan önce, sisteminizde Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) veya sonraki sürümünün kurulu olduğundan emin olun.

  • JDK 1.6 veya üstü yüklü.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPEG2000 Nedir JPEG2000 Dosya formatı

    JPEG 2000 (JP2), bir görüntü kodlama sistemi ve son teknoloji görüntü sıkıştırma standardıdır. Dalgacık teknolojisi kullanılarak tasarlanan JPEG 2000, kayıpsız içeriği herhangi bir kalitede bir kerede kodlayabilir. Ayrıca, kodlama verimliliğinde önemli bir ceza olmaksızın, JPEG 2000, aynı içeriğe etkili bir şekilde çeşitli diğer çözünürlük ve niteliklere erişme ve kodunu çözme yeteneğine sahiptir. JPEG 2000'deki kod akışları, uzamsal rasgele erişim olanağı sağlayan ilgi bölgelerine sahip olarak önemli ölçüde ölçeklenebilir. Terapixels'deki boyutları ve 38 bit/numune kadar yüksek hassasiyete sahip 16384'e kadar farklı bileşene sahip olma.

    Devamını oku

    DOC Nedir DOC Dosya formatı

    .doc uzantılı dosyalar, Microsoft Word veya diğer kelime işlem belgeleri tarafından ikili dosya biçiminde oluşturulan belgeleri temsil eder. Uzantı başlangıçta birkaç farklı işletim sisteminde düz metin belgeleri için kullanıldı. Düz metin, grafikler, çizelgeler, gömülü nesneler, bağlantılar, sayfalar, sayfa biçimlendirme, yazdırma ayarları ve daha pek çok biçimin yanı sıra biçimlendirilmiş görüntüler gibi birkaç farklı veri türü içerebilir. Bu format, kullanıcılara kılavuzlar, teklifler, şartnameler, özgeçmişler, makaleler veya benzeri belgeler yazmak için sunduğu çeşitli seçenekler nedeniyle her türlü belge için popülerdi. DOC'nin güncellenmiş sürümü, özellikleri açık olan Office OpenXML tabanlı DOCX'tir.

    Devamını oku

    TXT (Metin Belgesi Dosyası)
    Text (Metin Belgesi Dosyası)
    DOC (Microsoft Word tarafından oluşturulan belgeler)
    DOCX (Microsoft Word belgeleri)
    XLS (Microsoft Excel İkili Dosya Biçimi)
    XLSX (Microsoft Excel belgeleri)
    PDF (Taşınabilir Belge Formatı (PDF))
    Searchable PDF (Aranabilir Taşınabilir Ağ Grafikleri)
    XML (Genişletilebilir İşaretleme Dili)
    JSON (JavaScript Nesnesi Gösterimi)