Konvertieren Sie PDF in DOC in C#
Führen Sie eine optische Zeichenerkennung für das PDF-Dokument durch und speichern Sie Text als PDF-Dokument mit Aspose.OCR aus der .NET-Bibliothek.
So konvertieren Sie PDF in DOC mit C#
Aspose.OCR für .NET ist eine leistungsstarke, aber benutzerfreundliche und kostengünstige Bibliothek zum Konvertieren von PDF-Bildern in DOC-Dokumente. Die hochmoderne optische Zeichenerkennungs-Engine unterstützt 26 Sprachen basierend auf Latein, Kyrillisch und Chinesisch und bietet eine überlegene Erkennungsgeschwindigkeit und -genauigkeit, während Sie von Formeln, neuronalen Netzwerken und anderen komplexen technischen Details isoliert werden. Es ermöglicht Ihnen, OCR-Funktionalität zu Ihren .NET-Anwendungen in weniger als 10 Codezeilen hinzuzufügen.
verarbeitet gescannte Bilder oder sogar Smartphone-Fotos im PDF-Format und erstellt PDF-Dokumente mit erkanntem Text. Um es zu Ihrem Projekt hinzuzufügen, müssen Sie nur die Datei Aspose.OCR installieren.
Paket in Ihrem Projekt mit dem folgenden Befehl:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Schritte zum Konvertieren von PDF in DOC
Mit .NET OCR und nur wenigen Codezeilen können Sie eine voll funktionsfähige Anwendung erstellen, die ein PDF-Bild in ein DOC-Dokument konvertiert:
- Erstellen Sie eine Instanz der Klasse AsposeOcr
- Rufen Sie die Methode AsposeOCR.RecognizeImage auf
- Übergeben Sie den Dateipfad PDF als Parameter
- AsposeOCR.RecognizeImage gibt einen String oder eine Datei vom Typ DOC zurück
System Anforderungen
Stellen Sie vor dem Ausführen des Beispiels sicher, dass die mit der NET Standard 2.0-Spezifikation kompatible .NET-API auf Ihrem System installiert ist und alle [externen Abhängigkeiten]( https://docs.aspose.com/ocr/net/system-requirements/#external- Abhängigkeiten) des Aspose.OCR-Pakets werden in Ihrem Projekt referenziert.
- NET Standard 2.0+ kompatible Lösung
- Aspose.OCR für .NET, auf das in Ihrem Projekt verwiesen wird.
Dieser Beispielcode zeigt die Konvertierung von PDF in DOC .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.DOC", riText);
PDF Was ist PDF Datei Format
Portable Document Format (PDF) ist ein Dokumenttyp, der von Adobe in den 1990er Jahren erstellt wurde. Der Zweck dieses Dateiformats bestand darin, einen Standard für die Darstellung von Dokumenten und anderem Referenzmaterial in einem Format einzuführen, das unabhängig von Anwendungssoftware, Hardware und Betriebssystem ist. Das PDF-Dateiformat kann Informationen wie Text, Bilder, Hyperlinks, Formularfelder, Rich Media, digitale Signaturen, Anhänge, Metadaten, Geodaten und 3D-Objekte enthalten, die Teil des Quelldokuments werden können.
WeiterlesenDOC Was ist DOC Datei Format
Dateien mit der Erweiterung .doc stellen Dokumente dar, die von Microsoft Word oder anderen Textverarbeitungsdokumenten im Binärdateiformat generiert wurden. Die Erweiterung wurde ursprünglich für die Klartextdokumentation auf mehreren verschiedenen Betriebssystemen verwendet. Es kann verschiedene Arten von Daten enthalten, z. B. Bilder, formatierten sowie einfachen Text, Grafiken, Diagramme, eingebettete Objekte, Links, Seiten, Seitenformatierung, Druckeinstellungen und vieles mehr. Das Format war beliebt für alle Arten von Dokumentationen, da es den Benutzern eine Vielzahl von Optionen zum Schreiben von Handbüchern, Angeboten, Spezifikationen, Lebensläufen, Artikeln oder ähnlichen Dokumenten bietet. Die aktualisierte Version von DOC ist DOCX, das auf Office OpenXML basiert, dessen Spezifikationen offen verfügbar sind.
WeiterlesenAndere unterstützte Konvertierungen
Mit C# kann man problemlos verschiedene Formate konvertieren, einschließlich.