PDF Belge Çıkarma Çözümü

Ücretsiz platformlar arası Uygulamalar ve API’ler ile PDF belgelerinden görüntü ve metin ayıklayın

Aspose Library Kullanarak PDF Dosyası Nasıl Ayrıştırılır

Neden PDF belgelerini ayrıştırmayı kullanıyorsunuz? PDF Dosyasını Ayrıştırmak için, zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.PDF dosyasını arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz. PDF belgelerini ayrıştırmak, PDF dosyasından çeşitli bilgileri ayıklamak için kullanılan bir terimdir. Metin ve görüntüleri ayıklamak için PDF belgesini ayrıştırın. Ayrıca, PDF’yi metin ve resim olarak ayırmak için. Aspose.PDF Kütüphanesi, PDF’den ve pullardan metin çıkarmanıza, PDF’den görüntü ve yazı tiplerini çıkarmanıza, tablolardan ve formlardan veri çıkarmanıza olanak tanır.

Belgeyi Ayrıştırmak için Yüksek Kod API’leri .NET, .NET Core, Java, C++ ve Android kullanarak PDF dosyalarına yerel API’ler

PDF Dosyalarını Ayrıştırın

// Open document
Document pdfDocument = new Document(dataDir + "ExtractTextAll.pdf");

// Create TextAbsorber object to extract text
TextAbsorber textAbsorber = new TextAbsorber();
// Accept the absorber for all the pages
pdfDocument.Pages.Accept(textAbsorber);
// Get the extracted text
string extractedText = textAbsorber.Text;
// Create a writer and open the file
TextWriter tw = new StreamWriter(dataDir + "extracted-text.txt");
// Write a line of text to the file
tw.WriteLine(extractedText);
// Close the stream
tw.Close();