HTML JPG OCR XML BMP
Aspose.OCR  Java için
DOCX

Aspose.Imaging for Java

taranan görüntüleri ve hatta akıllı telefon fotoğraflarını BMP biçiminde işler ve tanınan metin içeren BMP belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.

Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCR ve yalnızca birkaç satır kod ile, bir BMP görüntüsünü DOCX belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:

  • AsposeOcr sınıfının bir örneğini oluşturun
  • AsposeOCR.RecognizePage yöntemini çağırın
  • BMP dosya yolunu parametre olarak iletin
  • AsposeOCR.RecognizePage, DOCX türünde bir String veya dosya döndürür

sistem gereksinimleri

Örneği çalıştırmadan önce, sisteminizde Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) veya sonraki sürümünün kurulu olduğundan emin olun.

  • JDK 1.6 veya üstü yüklü.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • BMP Nedir BMP Dosya formatı

    .BMP uzantısına sahip dosyalar, bitmap dijital görüntüleri depolamak için kullanılan Bitmap Görüntü dosyalarını temsil eder. Bu görüntüler grafik bağdaştırıcısından bağımsızdır ve aygıttan bağımsız bit eşlem (DIB) dosya biçimi olarak da adlandırılır. Bu bağımsızlık, dosyayı Microsoft Windows ve Mac gibi birden çok platformda açma amacına hizmet eder. BMP dosya formatı, verileri hem monokrom hem de çeşitli renk derinliklerine sahip renkli formatta iki boyutlu dijital görüntüler olarak saklayabilir.

    Devamını oku

    DOCX Nedir DOCX Dosya formatı

    DOCX, Microsoft Word belgeleri için iyi bilinen bir formattır. 2007'den itibaren Microsoft Office 2007'nin piyasaya sürülmesiyle tanıtılan bu yeni Belge biçiminin yapısı, düz ikili dosyadan XML ve ikili dosyaların bir kombinasyonuna değiştirildi. Docx dosyaları, Word 2007 ve yan sürümleriyle açılabilir, ancak MS Word'ün DOC dosya uzantılarını destekleyen önceki sürümleriyle açılamaz.

    Devamını oku

    TXT (Metin Belgesi Dosyası)
    Text (Metin Belgesi Dosyası)
    DOC (Microsoft Word tarafından oluşturulan belgeler)
    DOCX (Microsoft Word belgeleri)
    XLS (Microsoft Excel İkili Dosya Biçimi)
    XLSX (Microsoft Excel belgeleri)
    PDF (Taşınabilir Belge Formatı (PDF))
    Searchable PDF (Aranabilir Taşınabilir Ağ Grafikleri)
    XML (Genişletilebilir İşaretleme Dili)
    JSON (JavaScript Nesnesi Gösterimi)