Ekstrak PDF melalui C#

Cara Mengekstrak teks dan gambar dari PDF Menggunakan .NET Library

C# Java C++ Python

Aksi paling populer dengan Parser

Ekstrak Teks

Ekstrak Gambar

Ekstrak Font

Cara mengurai PDF dengan perpustakaan .NET

Apakah Anda perlu mengekstrak PDF? Modifikasi terprogram dokumen PDF adalah bagian penting dari alur kerja digital modern. Dengan perpustakaan .NET seperti Aspose.PDF, pengembang dapat mengekstrak teks dari PDF atau menarik gambar dari PDF. Perpustakaan ini adalah solusi yang berdiri sendiri yang tidak bergantung pada perangkat lunak lain dan siap untuk penggunaan komersial. Mereka mencakup semua kemungkinan kebutuhan pengembang C# profesional.

Ekstrak data PDF: teks, gambar, formulir, bidang, dll.
Ekstrak teks dari PDF
Ekstrak Gambar dari PDF
Ekstrak Font dari PDF
Ekstrak Data dari Formulir
Ekstrak Teks Dari Perangko
Ekstrak Data dari Tabel

Untuk mengekstrak file PDF, kita akan menggunakan API Aspose.PDF untuk.NET, yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform net. Buka manajer paket NuGet, cari Aspose.PDF dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Package Manager Console

PM > Install-Package Aspose.PDF

Mengurai PDF melalui C#

Untuk mencoba kode di lingkungan Anda, Anda perlu Aspose.PDF for .NET.

Muat PDF dengan contoh Dokumen.
Buat objek TextAbsorber untuk mengekstrak teks.
Terima penyerap untuk semua halaman.
Dapatkan teks yang diekstrak
Buat penulis dan buka file, tulis baris teks ke file

Ekstrak File PDF - C#

Kode contoh ini menunjukkan cara mengekstrak dokumen PDF

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

var inputFile = Path.Combine(dataDir, "ExtractTextAll.pdf");
var outputFile = Path.Combine(dataDir, "ExtractedText.txt");
var pdfDocument = new Aspose.Pdf.Document(inputFile);
var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
pdfDocument.Pages.Accept(textAbsorber);
File.WriteAllText(outputFile, textAbsorber.Text);

Tentang API Aspose.PDF for .NET

Aspose.PDF untuk .NET API menyediakan berbagai fitur untuk bekerja dengan file PDF. Beberapa fitur meliputi:

Buat dokumen PDF dari awal atau dari HTML, XML, atau gambar.
Edit dokumen PDF yang ada dengan menambahkan atau menghapus halaman, teks, gambar, dan konten lainnya.
Konversi dokumen PDF ke format lain seperti HTML, XML, dan gambar.
Render dokumen PDF ke gambar atau format XPS.
Cetak dokumen PDF langsung dari aplikasi Anda.
Tanda tangani dokumen PDF secara digital.

Anda dapat menemukan informasi lebih lanjut tentang Aspose.PDF untuk C# API di Dokumentasi Aspose ini