Solusi Ekstraksi Dokumen PDF

Ekstrak gambar & teks dari dokumen PDF dengan Aplikasi dan API lintas platform gratis

Cara Mengurai File PDF Menggunakan Aspose Library

Mengapa menggunakan parsing dokumen PDF? Untuk Parse PDF File, kita akan menggunakan Aspose.PDF API, yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan. Buka manajer paket nuget, cari Aspose.PDF dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket. Mengurai dokumen PDF adalah istilah dirilis untuk ekstraksi berbagai jenis informasi dari file PDF. Parse dokumen PDF untuk mengekstrak teks dan gambar. Juga, untuk memisahkan PDF sebagai teks dan gambar. Perpustakaan Aspose.PDF memungkinkan Anda mengekstrak teks dari PDF dan dari perangko, mengekstrak gambar dan font dari PDF, mengekstrak data dari tabel dan formulir.

API Kode Tinggi untuk Mengurai Dokumen API asli ke file PDF menggunakan .NET, .NET Core, Java, C++ & Android

Parse File PDF

// Open document
Document pdfDocument = new Document(dataDir + "ExtractTextAll.pdf");

// Create TextAbsorber object to extract text
TextAbsorber textAbsorber = new TextAbsorber();
// Accept the absorber for all the pages
pdfDocument.Pages.Accept(textAbsorber);
// Get the extracted text
string extractedText = textAbsorber.Text;
// Create a writer and open the file
TextWriter tw = new StreamWriter(dataDir + "extracted-text.txt");
// Write a line of text to the file
tw.WriteLine(extractedText);
// Close the stream
tw.Close();