Nederlands
  1. Producten
  2.   Aspose.Total
  3.   .NET
  4.   Parse
  5.   Extraheer tekst en afbeeldingen uit het DOC-bestand online en gebruik .NET

Parseer het DOC-bestand zowel online als via .NET

Ontwikkel een krachtige, op .NET gebaseerde DOC-hulpprogramma voor documentparser. C#-code vermeld voor extractie van DOC-documenttekst.

Parseer het DOC-document via de online app

  1. Importeer het DOC-bestand om het te parseren door het te uploaden.
  2. Doe dit door in het neerzetgebied te klikken via slepen en neerzetten van de parser-app.
  3. Wacht enkele seconden, afhankelijk van de grootte van het DOC-bestand en de internetsnelheid.
  4. Klik op de knop ‘Nu parseren’ om het document te parseren.
  5. Download de geparseerde bestanden om ze direct te bekijken.

Parseer het DOC-bestand via .NET

  1. Voeg een bibliotheekverwijzing toe aan het .NET-project
  2. Laad het DOC-bestand met behulp van het Document-klasseobject
  3. Haal alle onderliggende knooppunten op met GetChildNodes()
  4. Gebruik NodeType.Shape als parameter
  5. Doorloop elk knooppunt en sla de afbeelding op
  6. Voor tekstextractie loopt u door elke pagina
  7. Roep de ExtractPages-methode aan
  8. Sla het uitgepakte bestand op in tekst met behulp van de Node.ToString-methode
 

C#-code: DOC-extractie van documentafbeeldingen

 
 

C#-code: DOC-documenttekstextractie

 
 

Ontwikkel een DOC-bestandsparsertoepassing via .NET

Wilt u een DOC-parsertoepassing of -software ontwikkelen?Met Aspose.Words for .NET , een onderliggende API van Aspose.Total for .NET , kan elke .NET-ontwikkelaar de bovenstaande API-code integreren in zijn documentparsertoepassing.Dankzij de krachtige .NET-bibliotheek kunt u elke oplossing voor het parseren van documenten programmeren om zowel afbeeldingen als tekst te extraheren.Bovendien ondersteunt het vele populaire formaten, waaronder het DOC-formaat.

.NET-hulpprogramma om het DOC-bestand te verwerken voor parsertoepassingen

Er zijn alternatieve opties om Aspose.Words for .NET of Aspose.Total for .NET op uw systeem te installeren.Kies er een die aan uw behoeften voldoet en volg de stapsgewijze instructies:

systeem vereisten

Ons product is volledig platformonafhankelijk en ondersteunt alle belangrijke .NET-implementaties volgens de ‘.NET Standard 2.0’-specificatie:

  • Microsoft .NET Framework, beginnend bij de vroegste versie 2.0 en eindigend met de nieuwste ‘.NET Framework 4.8’
  • .NET Core, beginnend bij de vroegste versie 2.0 en eindigend met de nieuwste ‘.NET 6’
  • Mono >= 2.6.7

    Omdat .NET-code niet afhankelijk is van de onderliggende hardware of het besturingssysteem, maar alleen van een virtuele machine, bent u vrij om elke vorm van software te ontwikkelen voor Windows, macOS, Android, iOS en Linux.Zorg ervoor dat u de overeenkomstige versie van .NET Framework, .NET Core, Windows Azure, Mono of Xamarin hebt geïnstalleerd.

    We raden u aan Microsoft Visual Studio, Xamarin en MonoDevelop IDE te gebruiken om C#-, F#- en VB.NET-applicaties te maken.

    Voor meer details verwijzen wij u naar Productdocumentatie .

Veelgestelde vragen

  • Kan ik bovenstaande .NET-code in mijn applicatie gebruiken?
    Ja, u bent van harte welkom om deze code te downloaden en te gebruiken voor de ontwikkeling van een op .NET gebaseerde documentparsertoepassing.Deze code kan dienen als een waardevolle hulpbron om de functionaliteit en mogelijkheden van uw projecten op het gebied van backend-documentverwerking te verbeteren, zoals het lezen van knooppunten en het laden van het document voor het extraheren van tekst en afbeeldingen.
  • Werkt deze online documentparser-app alleen op Windows?
    U heeft de flexibiliteit om het parseren van documenten op elk apparaat te starten, ongeacht het besturingssysteem waarop het draait, of het nu Windows, Linux, Mac OS of Android is. Het enige dat nodig is, is een moderne webbrowser en een actieve internetverbinding.
  • Is het veilig om de online app te gebruiken voor het parseren van DOC-documenten?
    Natuurlijk! De uitvoerbestanden die via onze service worden gegenereerd, worden binnen 24 uur veilig en automatisch van onze servers verwijderd.Als gevolg hiervan zullen de weergavelinks die aan deze bestanden zijn gekoppeld, na deze periode niet meer functioneren.
  • Welke browser moet ik gebruiken?
    U kunt elke moderne webbrowser zoals Google Chrome, Firefox, Opera of Safari gebruiken voor online DOC-documentparser.Als u echter een desktoptoepassing ontwikkelt, raden we u aan de documentverwerkings-API Aspose.Total te gebruiken voor efficiënt beheer.

Ontdekken Bestandsparser Opties met .NET

Parseren DOC Bestanden (Microsoft Word binair formaat)
Parseren DOCX Bestanden (Office 2007+ Word-document)
Parseren DOT Bestanden (Microsoft Word-sjabloonbestanden)
Parseren DOTX Bestanden (Microsoft Word-sjabloonbestand)
Parseren ODP Bestanden (OpenDocument-presentatieformaat)
Parseren ODS Bestanden (OpenDocument-spreadsheet)
Parseren ODT Bestanden (OpenDocument Tekstbestandsindeling)
Parseren PDF Bestanden (Draagbaar documentformaat)
Parseren PPT Bestanden (PowerPoint presentatie)
Parseren PPTX Bestanden (Open XML-presentatieformaat)
Parseren RTF Bestanden (Rijk tekst formaat)
Parseren XLS Bestanden (Microsoft Excel binair formaat)
Parseren XLSB Bestanden (Excel binaire werkmap)
Parseren XLSM Bestanden (Spreadsheet met ingeschakelde macro's)
Parseren XLSX Bestanden (XML-werkmap openen)