HTML JPG OCR XML BMP
Aspose.OCR  C++ için
DOCX

Aspose.Imaging for Java

taranan görüntüleri ve hatta akıllı telefon fotoğraflarını PDF biçiminde işler ve tanınan metin içeren PDF belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.

Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

C++ OCR ve yalnızca birkaç satır kodla, bir PDF görüntüsünü DOCX belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:

  • AsposeOcr sınıfının bir örneğini oluşturun
  • AsposeOCR.asposeocr_page() yöntemini çağırın
  • PDF dosya yolunu parametre olarak iletin
  • AsposeOCR.asposeocr_page, DOCX türünde bir String veya dosya döndürür

sistem gereksinimleri

Örneği çalıştırmadan önce, projeye Microsoft.ML.OnnxRuntime 1.7.0 veya üzerinin eklendiğinden emin olun. Aspose.OCR’ı NuGet Paket Yöneticisi aracılığıyla kurarsanız, otomatik olarak kurulmalıdır.

  • NET Standard 2.0+ uyumlu çözüm
  • Projenizde referans verilen Aspose.OCR for .NET.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • PDF Nedir PDF Dosya formatı

    Taşınabilir Belge Formatı (PDF), Adobe tarafından 1990'larda oluşturulmuş bir belge türüdür. Bu dosya biçiminin amacı, belgelerin ve diğer başvuru malzemelerinin uygulama yazılımı, donanım ve İşletim Sisteminden bağımsız bir biçimde temsil edilmesi için bir standart getirmekti. PDF dosya formatı, kaynak belgenin bir parçası haline gelebilecek metin, resimler, köprüler, form alanları, zengin medya, dijital imzalar, ekler, meta veriler, Jeo-uzaysal özellikler ve 3B nesneler gibi bilgileri içerme konusunda tam kapasiteye sahiptir.

    Devamını oku

    DOCX Nedir DOCX Dosya formatı

    DOCX, Microsoft Word belgeleri için iyi bilinen bir formattır. 2007'den itibaren Microsoft Office 2007'nin piyasaya sürülmesiyle tanıtılan bu yeni Belge biçiminin yapısı, düz ikili dosyadan XML ve ikili dosyaların bir kombinasyonuna değiştirildi. Docx dosyaları, Word 2007 ve yan sürümleriyle açılabilir, ancak MS Word'ün DOC dosya uzantılarını destekleyen önceki sürümleriyle açılamaz.

    Devamını oku