راه حل استخراج اسناد PDF

استخراج تصاویر و متن از اسناد PDF با برنامه ها و API های کراس پلت فرم رایگان

نحوه تجزیه فایل PDF با استفاده از کتابخانه Aspose

** چرا از تجزیه اسناد PDF استفاده می شود؟ ** برای تجزیه فایل PDF، از API Aspose.PDF استفاده خواهیم کرد که یک API دستکاری اسناد قدرتمند، قدرتمند و آسان برای استفاده است. NuGet مدیر بسته را باز کنید، Aspose.PDF را جستجو کنید و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید. تجزیه اسناد پی دی اف یک اصطلاح releated برای استخراج انواع مختلف اطلاعات از فایل PDF است. قابلیت تجزیه سند پی دی اف جهت استخراج متن و تصاویر همچنین، برای جدا کردن PDF به عنوان متن و تصاویر. Aspose.PDF Library به شما امکان می دهد متن را از PDF و تمبر استخراج کنید، تصاویر و فونت ها را از PDF استخراج کنید، داده ها را از جداول و فرم ها استخراج کنید.

API های کد بالا برای تجزیه سند API های بومی به فایل های PDF با استفاده از دات نت، دات نت کور، زامارین، جاوا، سی پلاس پلاس و اندروید

تجزیه فایل های پی دی اف

// Open document
Document pdfDocument = new Document(dataDir + "ExtractTextAll.pdf");

// Create TextAbsorber object to extract text
TextAbsorber textAbsorber = new TextAbsorber();
// Accept the absorber for all the pages
pdfDocument.Pages.Accept(textAbsorber);
// Get the extracted text
string extractedText = textAbsorber.Text;
// Create a writer and open the file
TextWriter tw = new StreamWriter(dataDir + "extracted-text.txt");
// Write a line of text to the file
tw.WriteLine(extractedText);
// Close the stream
tw.Close();