جستجوی فایل های پی دی اف در Java

جستجوی اسناد پی دی اف بومی و با کارایی بالا با استفاده از Aspose.PDF سمت سرور برای API های Java بدون استفاده از نرم افزار هایی مانند Microsoft یا Adobe PDF.

نحوه جستجوی فایل PDF با استفاده از Java

به منظور جستجوی PDF، ما از API [Aspose.PDF for Java(https://products.aspose.com/pdf/java) استفاده خواهیم کرد که یک API تبدیل قدرتمند، قدرتمند و آسان برای استفاده برای پلت فرم جاوا است. می توانید آخرین نسخه آن را مستقیماً از MAVEN بارگیری کرده و با افزودن تنظیمات زیر به pom.xml، آن را در پروژه مبتنی بر Maven خود نصب کنید.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

جستجوی فایل پی دی اف از طریق Java


شما نیاز به Aspose.PDF for Java به سعی کنید کد در محیط شما.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد تکست Fragmentabsorber شی با متن برای پیدا کردن به عنوان پارامتر. ۱. تمام مجموعه قطعات متن استخراج شده را دریافت کنید. ۱. حلقه را از طریق هر قطعه برای به دست آوردن تمام اطلاعات خود را.

جستجوی فایل های پی دی اف - Java


// Load PDF document
Document pdfDocument = new Document("source.pdf");

// Create TextAbsorber object to find all instances of the input search phrase
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("\d{4}-\d{4}"); // like 1999-2000

// Set text search option to specify regular expression usage
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textFragmentAbsorber.setTextSearchOptions(textSearchOptions);

// Accept the absorber for first page of document
pdfDocument.getPages().accept(textFragmentAbsorber);

// Get the extracted text fragments into collection
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.getTextFragments();

// Loop through the fragments
for (TextFragment textFragment : (Iterable<TextFragment>) textFragmentCollection) {
	System.out.println("Text :- " + textFragment.getText());
	System.out.println("Position :- " + textFragment.getPosition());
	System.out.println("XIndent :- " + textFragment.getPosition().getXIndent());
	System.out.println("YIndent :- " + textFragment.getPosition().getYIndent());
	System.out.println("Font - Name :- " + textFragment.getTextState().getFont().getFontName());
	System.out.println("Font - IsAccessible :- " + textFragment.getTextState().getFont().isAccessible());
	System.out.println("Font - IsEmbedded - " + textFragment.getTextState().getFont().isEmbedded());
	System.out.println("Font - IsSubset :- " + textFragment.getTextState().getFont().isSubset());
	System.out.println("Font Size :- " + textFragment.getTextState().getFontSize());
	System.out.println("Foreground Color :- " + textFragment.getTextState().getForegroundColor());
}