HTML JPG OCR XML BMP
Aspose.OCR  voor .NET
PDF

Converteer PDF naar PDF in C#

Voer optische tekenherkenning uit op het PDF-document en sla de tekst op als PDF-document met behulp van Aspose.OCR uit de .NET-bibliotheek.

Hoe PDF naar PDF te converteren met C#

Aspose.OCR voor .NET is een krachtige maar gebruiksvriendelijke en kosteneffectieve bibliotheek voor het converteren van PDF-afbeeldingen naar PDF-documenten. De ultramoderne optische tekenherkenningsengine ondersteunt 26 talen op basis van Latijn, Cyrillisch en Chinees en biedt superieure herkenningssnelheid en nauwkeurigheid, terwijl u wordt geïsoleerd van formules, neurale netwerken en andere complexe technische details. Hiermee kunt u OCR-functionaliteit toevoegen aan uw .NET-toepassingen in minder dan 10 regels code.

Aspose.OCR voor .NET

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in PDF-indeling en maakt PDF-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar de Aspose.OCR te installeren

NuGet

pakket in uw project met de volgende opdracht:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Stappen om PDF naar PDF te converteren

Met .NET OCR en slechts een paar regels code, kunt u een complete toepassing maken die een PDF-afbeelding converteert naar een PDF-document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep AsposeOCR.RecognizeImage-methode aan
  • Geef het PDF bestandspad door als parameter
  • AsposeOCR.RecognizeImage retourneert een String of bestand van het type PDF

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat .NET API die compatibel is met de NET Standard 2.0-specificatie is geïnstalleerd op uw systeem en op alle [externe afhankelijkheden]( https://docs.aspose.com/ocr/net/system-requirements/#external- afhankelijkheden) van het Aspose.OCR-pakket worden verwezen in uw project.

  • NET Standard 2.0+ compatibele oplossing
  • Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.

Deze voorbeeldcode toont PDF naar PDF .NET Conversie


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.PDF", riText);
  • PDF Wat is PDF Bestandsformaat

    Portable Document Format (PDF) is een type document dat in de jaren negentig door Adobe is gemaakt. Het doel van dit bestandsformaat was om een ​​standaard te introduceren voor de weergave van documenten en ander referentiemateriaal in een formaat dat onafhankelijk is van applicatiesoftware, hardware en besturingssysteem. Het PDF-bestandsformaat heeft volledige mogelijkheden om informatie zoals tekst, afbeeldingen, hyperlinks, formuliervelden, rich media, digitale handtekeningen, bijlagen, metadata, geospatiale functies en 3D-objecten erin te bevatten die als onderdeel van het brondocument kunnen worden gebruikt.

    Lees verder

    PDF Wat is PDF Bestandsformaat

    Portable Document Format (PDF) is een type document dat in de jaren negentig door Adobe is gemaakt. Het doel van dit bestandsformaat was om een ​​standaard te introduceren voor de weergave van documenten en ander referentiemateriaal in een formaat dat onafhankelijk is van applicatiesoftware, hardware en besturingssysteem. Het PDF-bestandsformaat heeft volledige mogelijkheden om informatie zoals tekst, afbeeldingen, hyperlinks, formuliervelden, rich media, digitale handtekeningen, bijlagen, metadata, geospatiale functies en 3D-objecten erin te bevatten die als onderdeel van het brondocument kunnen worden gebruikt.

    Lees verder

    Andere ondersteunde conversies

    Met C# kan men gemakkelijk verschillende formaten converteren, waaronder.

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)
    XML (Uitbreidbare opmaaktaal)
    JSON (JavaScript-objectnotatie)