taranan görüntüleri ve hatta akıllı telefon fotoğraflarını PDF biçiminde işler ve tanınan metin içeren PDF belgeleri oluşturur. Projenize eklemek için Aspose.OCR almanız yeterlidir.
Maven veya Aspose Maven Repository yapılandırmasını belirtin ve aşağıdaki konfigürasyonları pom.xml dosyasına ekleyerek Maven tabanlı projenize kurun. Graddle, Ivy, Sbt örnekleri için depomuza göz atın.
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
C++ OCR ve yalnızca birkaç satır kodla, bir PDF görüntüsünü DOC belgesine dönüştüren tam özellikli bir uygulama oluşturabilirsiniz:
- AsposeOcr sınıfının bir örneğini oluşturun
- AsposeOCR.asposeocr_page() yöntemini çağırın
- PDF dosya yolunu parametre olarak iletin
- AsposeOCR.asposeocr_page, DOC türünde bir String veya dosya döndürür
sistem gereksinimleri
Örneği çalıştırmadan önce, projeye Microsoft.ML.OnnxRuntime 1.7.0 veya üzerinin eklendiğinden emin olun. Aspose.OCR’ı NuGet Paket Yöneticisi aracılığıyla kurarsanız, otomatik olarak kurulmalıdır.
- NET Standard 2.0+ uyumlu çözüm
- Projenizde referans verilen Aspose.OCR for .NET.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
PDF Nedir PDF Dosya formatı
Taşınabilir Belge Formatı (PDF), Adobe tarafından 1990'larda oluşturulmuş bir belge türüdür. Bu dosya biçiminin amacı, belgelerin ve diğer başvuru malzemelerinin uygulama yazılımı, donanım ve İşletim Sisteminden bağımsız bir biçimde temsil edilmesi için bir standart getirmekti. PDF dosya formatı, kaynak belgenin bir parçası haline gelebilecek metin, resimler, köprüler, form alanları, zengin medya, dijital imzalar, ekler, meta veriler, Jeo-uzaysal özellikler ve 3B nesneler gibi bilgileri içerme konusunda tam kapasiteye sahiptir.
Devamını okuDOC Nedir DOC Dosya formatı
.doc uzantılı dosyalar, Microsoft Word veya diğer kelime işlem belgeleri tarafından ikili dosya biçiminde oluşturulan belgeleri temsil eder. Uzantı başlangıçta birkaç farklı işletim sisteminde düz metin belgeleri için kullanıldı. Düz metin, grafikler, çizelgeler, gömülü nesneler, bağlantılar, sayfalar, sayfa biçimlendirme, yazdırma ayarları ve daha pek çok biçimin yanı sıra biçimlendirilmiş görüntüler gibi birkaç farklı veri türü içerebilir. Bu format, kullanıcılara kılavuzlar, teklifler, şartnameler, özgeçmişler, makaleler veya benzeri belgeler yazmak için sunduğu çeşitli seçenekler nedeniyle her türlü belge için popülerdi. DOC'nin güncellenmiş sürümü, özellikleri açık olan Office OpenXML tabanlı DOCX'tir.
Devamını oku