Wyodrębnij metadane PDF przez Java

Wyodrębnij metadane z dokumentu PDF. Użyj pliku Aspose.PDF dla Java, aby programowo modyfikować pliki PDF

Jak wyodrębnić metadane PDF za pomocą biblioteki Java

Wyodrębnij metadane z pliku PDF za pomocą Aspose.PDF dla Java. Dostęp do metadanych dokumentu oznacza uzyskanie informacji o tym pliku, takich jak jego tytuł, autor, czas jego utworzenia i określone słowa kluczowe. Wyodrębnij metadane, pomaga efektywniej organizować dużą kolekcję plików PDF. Dane wyodrębnione z metadanych poprawiają sposób wyszukiwania plików. Użytkownicy mogą szybko zlokalizować określone dokumenty, używając słów kluczowych lub szczegółów znajdujących się w wyodrębnionych metadanych. Wyodrębnianie metadanych daje cenny wgląd w to, co zawiera plik. Może zawierać krótkie podsumowanie kluczowych szczegółów dotyczących pliku, ułatwiając zrozumienie, o czym jest dokument bez konieczności jego otwierania. Wyodrębnianie metadanych pomaga zapewnić autentyczność dokumentu. Możesz sprawdzić szczegóły, takie jak imię i nazwisko autora, kiedy został utworzony, lub historię jego modyfikacji. Ta weryfikacja ma kluczowe znaczenie dla potwierdzenia niezawodności pliku PDF. Oferując zwięzłe szczegóły dotyczące zawartości pliku PDF, wyodrębnione metadane znacznie poprawiają wrażenia użytkownika. Pomaga użytkownikom łatwo identyfikować i pracować z dokumentami. Ogólnie rzecz biorąc, wyodrębnianie metadanych PDF daje wiele korzyści, takich jak wydajniejsze zarządzanie dokumentami, ulepszone opcje wyszukiwania, zgodność ze standardami i ogólnie ulepszone wrażenia użytkownika. Wyodrębnij metadane z pliku PDF za pomocą Aspose i rozwiąż wszystkie niezbędne zadania w pracy z danymi. Aby wyodrębnić metadane z plików PDF, użyjemy interfejsu API Aspose.PDF for Java, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API konwersji dla platformy Java. Możesz pobrać najnowszą wersję bezpośrednio z Maven i zainstalować ją w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Wyodrębnij metadane PDF przez Java


Potrzebujesz Aspose.PDF for Java, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF z wystąpieniem dokumentu.
  2. Pobierz DocumentInfo za pomocą właściwości Document.info.
  3. Dostęp i wyświetlanie różnych właściwości Document.info.

Dostarczony fragment kodu Java pokazuje, jak wyodrębnić metadane z pliku PDF przez bibliotekę Aspose.PDF. Otwiera plik PDF o nazwie „GetFileInfo.pdf” znajdujący się w katalogu określonym przez zmienną „DIR_INPUT_METADATA”. Kod pobiera różne szczegóły z dokumentu za pomocą funkcji „info”. Wyświetla określone informacje o metadanych z pliku PDF, takie jak imię i nazwisko autora, data utworzenia, słowa kluczowe, data modyfikacji, temat i tytuł. Kod używa funkcji „print”, aby wyświetlić te informacje. Ten fragment kodu jest uproszczonym przykładem użycia biblioteki lub frameworka Aspose.PDF do wyodrębniania metadanych z pliku PDF.

Wyodrębnij metadane PDF - Java

Ten przykładowy kod pokazuje, jak wyodrębnić informacje o metadanych pliku PDF

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());