PDF Dosyalarını Java içinde ara

Microsoft veya Adobe PDF gibi herhangi bir yazılım kullanmadan Java API’leri için sunucu tarafı Aspose.PDF kullanarak yerel ve yüksek performanslı PDF belge araması.

Java Kullanarak PDF Dosyası Nasıl Aranır

PDF’yi aramak için, Java platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir dönüşüm API’si olan Java için Aspose.PDF API’sini kullanacağız. En son sürümünü doğrudan Maven adresinden indirebilir vepom.xml öğesine aşağıdaki yapılandırmaları ekleyerek Maven tabanlı projenize yükleyebilirsiniz.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Java aracılığıyla PDF Dosyasını Ara


Ortamınızdaki kodu denemek için Java için Aspose.PDF gerekir.

  1. PDF’yi bir Belge örneğiyle yükleyin.
  2. Parametre olarak bulmak için metinle TextFragmenTabsorber Nesnesi oluşturun.
  3. Çıkarılan tüm metin parçaları koleksiyonunu alın.
  4. Tüm bilgilerini almak için her parçayı dolaşın.

PDF Dosyalarında Ara - Java.


// Load PDF document
Document pdfDocument = new Document("source.pdf");

// Create TextAbsorber object to find all instances of the input search phrase
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("\d{4}-\d{4}"); // like 1999-2000

// Set text search option to specify regular expression usage
TextSearchOptions textSearchOptions = new TextSearchOptions(true);
textFragmentAbsorber.setTextSearchOptions(textSearchOptions);

// Accept the absorber for first page of document
pdfDocument.getPages().accept(textFragmentAbsorber);

// Get the extracted text fragments into collection
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.getTextFragments();

// Loop through the fragments
for (TextFragment textFragment : (Iterable<TextFragment>) textFragmentCollection) {
	System.out.println("Text :- " + textFragment.getText());
	System.out.println("Position :- " + textFragment.getPosition());
	System.out.println("XIndent :- " + textFragment.getPosition().getXIndent());
	System.out.println("YIndent :- " + textFragment.getPosition().getYIndent());
	System.out.println("Font - Name :- " + textFragment.getTextState().getFont().getFontName());
	System.out.println("Font - IsAccessible :- " + textFragment.getTextState().getFont().isAccessible());
	System.out.println("Font - IsEmbedded - " + textFragment.getTextState().getFont().isEmbedded());
	System.out.println("Font - IsSubset :- " + textFragment.getTextState().getFont().isSubset());
	System.out.println("Font Size :- " + textFragment.getTextState().getFontSize());
	System.out.println("Foreground Color :- " + textFragment.getTextState().getForegroundColor());
}