Converteer JPG naar DOCX in C#
Voer optische tekenherkenning uit op het JPG-document en sla de tekst op als JPG-document met behulp van Aspose.OCR uit de .NET-bibliotheek.
Hoe JPG naar DOCX te converteren met C#
Aspose.OCR voor .NET is een krachtige maar gebruiksvriendelijke en kosteneffectieve bibliotheek voor het converteren van JPG-afbeeldingen naar DOCX-documenten. De ultramoderne optische tekenherkenningsengine ondersteunt 26 talen op basis van Latijn, Cyrillisch en Chinees en biedt superieure herkenningssnelheid en nauwkeurigheid, terwijl u wordt geïsoleerd van formules, neurale netwerken en andere complexe technische details. Hiermee kunt u OCR-functionaliteit toevoegen aan uw .NET-toepassingen in minder dan 10 regels code.
verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in JPG-indeling en maakt JPG-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar de Aspose.OCR te installeren
pakket in uw project met de volgende opdracht:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Stappen om JPG naar DOCX te converteren
Met .NET OCR en slechts een paar regels code, kunt u een complete toepassing maken die een JPG-afbeelding converteert naar een DOCX-document:
- Maak een instantie van de AsposeOcr-klasse
- Roep AsposeOCR.RecognizeImage-methode aan
- Geef het JPG bestandspad door als parameter
- AsposeOCR.RecognizeImage retourneert een String of bestand van het type DOCX
systeem vereisten
Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat .NET API die compatibel is met de NET Standard 2.0-specificatie is geïnstalleerd op uw systeem en op alle [externe afhankelijkheden]( https://docs.aspose.com/ocr/net/system-requirements/#external- afhankelijkheden) van het Aspose.OCR-pakket worden verwezen in uw project.
- NET Standard 2.0+ compatibele oplossing
- Aspose.OCR voor .NET waarnaar in uw project wordt verwezen.
Deze voorbeeldcode toont JPG naar DOCX .NET Conversie
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPG");
// print text
File. File.WriteAllText("document.DOCX", riText);
JPG Wat is JPG Bestandsformaat
Een JPEG is een type afbeeldingsformaat dat wordt opgeslagen met de methode van compressie met verlies. Het uitvoerbeeld, als resultaat van compressie, is een afweging tussen opslaggrootte en beeldkwaliteit. Gebruikers kunnen het compressieniveau aanpassen om het gewenste kwaliteitsniveau te bereiken en tegelijkertijd de opslagruimte verkleinen. De beeldkwaliteit wordt verwaarloosbaar beïnvloed als 10:1 compressie op de afbeelding wordt toegepast. Hoe hoger de compressiewaarde, hoe groter de verslechtering van de beeldkwaliteit.
Lees verderDOCX Wat is DOCX Bestandsformaat
DOCX is een bekend formaat voor Microsoft Word-documenten. Geïntroduceerd vanaf 2007 met de release van Microsoft Office 2007, werd de structuur van dit nieuwe documentformaat veranderd van gewoon binair naar een combinatie van XML en binaire bestanden. Docx-bestanden kunnen worden geopend met Word 2007 en laterale versies, maar niet met de eerdere versies van MS Word die DOC-bestandsextensies ondersteunen.
Lees verderAndere ondersteunde conversies
Met C# kan men gemakkelijk verschillende formaten converteren, waaronder.