استخراج PDF از طریق C#

نحوه استخراج متن و تصاویر از PDF با استفاده از کتابخانه .NET

C# Java C++ Python

محبوب ترین اقدام با پارسر

استخراج متن

استخراج تصاویر

استخراج فونت

نحوه تجزیه PDF با کتابخانه .NET

آیا نیاز به استخراج PDF دارید؟ اصلاح برنامه نویسی اسناد PDF بخش مهمی از گردش کار دیجیتال مدرن است. با کتابخانه.NET مانند Aspose.PDF، توسعه دهندگان می توانند متن را از PDF استخراج کنند یا تصاویر را از PDF بگیرند. این کتابخانه‌ها راه حل‌های مستقل هستند که به نرم‌افزارهای دیگر تکیه ندارند و برای استفاده تجاری آماده هستند. آنها تمام نیازهای احتمالی توسعه دهندگان حرفه ای C# را پوشش می دهند.

استخراج داده های PDF: متون، تصاویر، فرم ها، زمینه ها و غیره
استخراج متن از PDF
استخراج تصاویر از PDF
استخراج فونت از PDF
استخراج داده ها از فرم
استخراج متن از تمبر
استخراج داده ها از جدول

برای استخراج فایل PDF، از Aspose.PDF for .NET API استفاده خواهیم کرد که یک API دستکاری سند غنی از ویژگی، قدرتمند و آسان برای پلت فرم net است. مدیر بسته NuGet را باز کنید، Aspose.PDF را جستجو کنید و نصب کنید. همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Package Manager Console

PM > Install-Package Aspose.PDF

تجزیه PDF از طریق C#

برای امتحان کد در محیط خود، شما نیاز به Aspose.PDF برای .NET.

۱. PDF را با یک نمونه از سند بارگذاری کنید. ۱. یک شیء TextAbsorber برای استخراج متن ایجاد کنید. ۱. جذب کننده را برای همه صفحات بپذیرید. ۱. متن استخراج شده را دریافت کنید ۱. یک نویسنده ایجاد کنید و فایل را باز کنید، یک خط متن را به فایل بنویسید

استخراج فایلهای PDF - C#

این کد نمونه نحوه استخراج اسناد PDF را نشان می دهد

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

var inputFile = Path.Combine(dataDir, "ExtractTextAll.pdf");
var outputFile = Path.Combine(dataDir, "ExtractedText.txt");
var pdfDocument = new Aspose.Pdf.Document(inputFile);
var textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
pdfDocument.Pages.Accept(textAbsorber);
File.WriteAllText(outputFile, textAbsorber.Text);

محبوب ترین اقدام با پارسر

نحوه تجزیه PDF با کتابخانه .NET

تجزیه PDF از طریق C#

استخراج فایلهای PDF - C#

درباره Aspose.PDF for .NET API