Analyzujte soubor PDF online a také extrahujte text nebo obrázky přes .NET
Vyvíjejte výkonnou obslužnou aplikaci pro analýzu dokumentů PDF na bázi .NET.C# kód uvedený pro obrázky dokumentů PDF a extrakci textu.
Analyzujte dokument PDF prostřednictvím online aplikace
- Importujte soubor PDF k analýze jeho nahráním.
- Udělejte to kliknutím do oblasti přetažení pomocí aplikace analyzátoru přetažením.
- V závislosti na velikosti souboru PDF a rychlosti internetu počkejte několik sekund.
- Chcete-li dokument analyzovat, klikněte na tlačítko ‘Parse Now’.
- Stáhněte si analyzované soubory k okamžitému zobrazení.
Analyzujte soubor PDF přes .NET
- Přidejte odkaz na knihovnu do projektu .NET
- Načtěte soubor PDF pomocí třídy Document
- Použijte objekt třídy TextAbsorber
- Přijměte absorbér pro všechny stránky
- Získejte extrahovaný text a napište
Kód C#: Extrakce textu dokumentu PDF
Document pdfDocument = new Document(dataDir + "ExtractTextAll.pdf"); | |
TextAbsorber textAbsorber = new TextAbsorber(); | |
pdfDocument.Pages.Accept(textAbsorber); | |
string extractedText = textAbsorber.Text; | |
TextWriter tw = new StreamWriter(dataDir + "extracted-text.txt"); | |
tw.WriteLine(extractedText); | |
tw.Close(); |
Kód C#: Extrakce obrázků dokumentů PDF
Document pdfDocument = new Document(dataDir+ "ExtractImages.pdf"); | |
XImage xImage = pdfDocument.Pages[1].Resources.Images[1]; | |
FileStream outputImage = new FileStream(dataDir + "output.jpg", FileMode.Create); | |
xImage.Save(outputImage, ImageFormat.Jpeg); | |
outputImage.Close(); | |
dataDir = dataDir + "ExtractImages_out.pdf"; | |
pdfDocument.Save(dataDir); |
Vyvíjejte aplikaci PDF File Parser přes .NET
Potřebujete vyvinout aplikaci nebo nástroj pro analýzu PDF?S
Aspose.PDF for .NET
, podřízeným API
Aspose.Total for .NET
, může každý vývojář pythonu integrovat výše uvedený kód API do své aplikace analyzátoru dokumentů.Výkonná knihovna .NET umožňuje naprogramovat jakékoli řešení analýzy dokumentů pro extrahování obrázků i textu.Navíc může podporovat mnoho populárních formátů včetně formátu PDF.
Nástroj .NET pro zpracování souboru PDF pro aplikaci parser
Existují alternativní možnosti instalace Aspose.PDF for .NET nebo Aspose.Total for .NET do vašeho systému.Vyberte si prosím ten, který odpovídá vašim potřebám, a postupujte podle pokynů krok za krokem:
- Nainstalujte Balíček NuGet . Viz Dokumentace
- Nainstalujte knihovnu pomocí Konzole správce balíčků v rámci Visual Studio IDE
Požadavky na systém
Náš produkt je plně multiplatformní a podporuje všechny hlavní implementace .NET podle specifikace ‘.NET Standard 2.0’:
- Microsoft .NET Framework, počínaje nejstarší verzí 2.0 a konče nejnovějším ‘.NET Framework 4.8’
- .NET Core, počínaje nejstarší verzí 2.0 a konče nejnovější verzí ‘.NET 6’
- Mono >= 2.6.7
Protože kód .NET se nespoléhá na základní hardware nebo operační systém, ale pouze na virtuální počítač, můžete tedy volně vyvíjet jakýkoli druh softwaru pro Windows, macOS, Android, iOS a Linux.Jen se ujistěte, že máte nainstalovanou odpovídající verzi .NET Framework, .NET Core, Windows Azure, Mono nebo Xamarin.
K vytváření aplikací C#, F#, VB.NET doporučujeme používat Microsoft Visual Studio, Xamarin a MonoDevelop IDE.
Další podrobnosti naleznete v Produktová dokumentace .
Nejčastější dotazy
- Mohu použít výše uvedený kód .NET ve své aplikaci?Ano, můžete si stáhnout tento kód a použít jej pro účely vývoje aplikace pro analýzu dokumentů na bázi .NET.Tento kód může sloužit jako cenný zdroj pro vylepšení funkčnosti a schopností vašich projektů v doméně backendového zpracování dokumentů, jako je čtení uzlů a načítání dokumentu pro extrakci textu a obrázků.
- Funguje tato online aplikace pro analýzu dokumentů pouze v systému Windows?Máte možnost zahájit analýzu dokumentů na jakémkoli zařízení, bez ohledu na operační systém, na kterém běží, ať už je to Windows, Linux, Mac OS nebo Android. Vše, co potřebujete, je moderní webový prohlížeč a aktivní připojení k internetu.
- Je bezpečné používat online aplikaci pro analýzu dokumentu PDF?Samozřejmě! Výstupní soubory generované prostřednictvím naší služby budou bezpečně a automaticky odstraněny z našich serverů během 24 hodin.V důsledku toho po uplynutí této doby přestanou být odkazy na zobrazení spojené s těmito soubory funkční.
- Jaký prohlížeč by měl používat aplikaci?Pro online analyzátor dokumentů PDF můžete použít jakýkoli moderní webový prohlížeč, jako je Google Chrome, Firefox, Opera nebo Safari.Pokud však vyvíjíte desktopovou aplikaci, doporučujeme pro efektivní správu použít rozhraní API pro zpracování dokumentů Aspose.Total.