verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in PDF-indeling en maakt PDF-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.
Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Met C++ OCR en slechts een paar regels code, kun je een complete applicatie maken die een PDF afbeelding converteert naar een Searchable PDF document:
- Maak een instantie van de AsposeOcr-klasse
- Roep de methode AsposeOCR.asposeocr_page() aan
- Geef het PDF bestandspad door als parameter
- AsposeOCR.asposeocr_page retourneert een String of bestand van het type Searchable PDF
systeem vereisten
Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Microsoft.ML.OnnxRuntime 1.7.0 of hoger aan het project is toegevoegd. Het zou automatisch moeten worden geïnstalleerd als u Aspose.OCR installeert via NuGet Package Manager.
- NET Standard 2.0+ compatibele oplossing
- Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
PDF Wat is PDF Bestandsformaat
Portable Document Format (PDF) is een type document dat in de jaren negentig door Adobe is gemaakt. Het doel van dit bestandsformaat was om een standaard te introduceren voor de weergave van documenten en ander referentiemateriaal in een formaat dat onafhankelijk is van applicatiesoftware, hardware en besturingssysteem. Het PDF-bestandsformaat heeft volledige mogelijkheden om informatie zoals tekst, afbeeldingen, hyperlinks, formuliervelden, rich media, digitale handtekeningen, bijlagen, metadata, geospatiale functies en 3D-objecten erin te bevatten die als onderdeel van het brondocument kunnen worden gebruikt.
Lees verderSearchable PDF Wat is Searchable PDF Bestandsformaat
Doorzoekbare PDF-bestanden behouden de originele gescande afbeelding voor weergave, evenals OCR-tekst in een verborgen laag die kan worden gebruikt voor zoekopdrachten in volledige tekst in een document of om tekst te markeren voor kopieer- en plakbewerkingen. Volledige OCR-conversie naar PDF, exclusief de originele afbeelding, zal nooit 100% van de originele opmaak behouden, vooral als het document veel afbeeldingen of een complexe lay-out heeft.
Lees verder