Извлекайте данные из PDF-форм с помощью Java

Извлеките поля пользовательских данных из заполняемого PDF-документа. Используйте Aspose.PDF для Java для программного изменения PDF-файлов

Как извлечь данные из PDF-форм с помощью библиотеки Java

Для извлечения данных из PDF-форм (Acroforms) мы будем использовать API Aspose.PDF для Java, который представляет собой многофункциональный, мощный и простой в использовании API преобразования для платформы Java. Последнюю версию можно загрузить непосредственно с сайта Maven и установить в свой проект на базе Maven, добавив следующие конфигурации в pom.xml.

Как извлечь AcroForm в PDF с помощью Java


Вам понадобится Aspose.PDF for Java, чтобы попробовать код в своей среде.

  1. Загрузите PDF в экземпляр класса Document.
  2. Получение значений из всех полей с помощью класса Document.Form.
  3. При необходимости проанализируйте имена и значения.
  4. Загрузить PDF в экземпляр класса Document
  5. Получение значений из всех полей с помощью класса Document.Form

Извлечение данных из PDF-форм - Java

В этом примере кода показано, как извлекать данные из PDF-форм в PDF с помощью Java

// Open document
String inputFile = DATA_DIR.resolve("sample.pdf").toString();
try (Document pdfDocument = new Document(inputFile)) {

    // Get values from all fields
    for (WidgetAnnotation field : pdfDocument.getForm()) {
        // Cast to FormField
        Field formField = (Field) field;
        // Analyze names and values if needed
        System.out.println("Field Name : " + formField.getPartialName());
        System.out.println("Value : " + formField.getValue());
    }
}