فراداده PDF را از طریق Java استخراج کنید

استخراج فراداده از سند PDF. از Aspose.PDF برای Java استفاده کنید تا فایل های PDF را به صورت برنامه نویسی تغییر دهید

نحوه استخراج فراداده PDF با استفاده از کتابخانه Java

استخراج فراداده از PDF با استفاده از Aspose.PDF برای جاوا. دسترسی به فراداده یک سند به معنای دریافت اطلاعات مربوط به آن فایل، مانند عنوان، نویسنده، زمان ایجاد آن و کلمات کلیدی خاص است. استخراج فراداده، به سازماندهی مجموعه بزرگی از PDF به طور موثرتر کمک می کند. داده های استخراج شده از فراداده ها نحوه جستجوی فایل ها را بهبود می بخشد. کاربران می توانند با استفاده از کلمات کلیدی یا جزئیات موجود در فراداده استخراج شده به سرعت اسناد خاصی را پیدا کنند. استخراج فراداده بینش ارزشمندی در مورد آنچه یک فایل شامل می شود ارائه می دهد. ممکن است خلاصه مختصری از جزئیات کلیدی در مورد فایل ارائه دهد و درک مطلب سند را بدون نیاز به باز کردن آن آسان تر کند. استخراج فراداده به اطمینان از معتبر بودن سند کمک می کند. شما می توانید جزئیاتی مانند نام نویسنده هنگام ایجاد یا تاریخچه اصلاح آن را بررسی کنید. این تأیید برای تأیید قابلیت اطمینان PDF بسیار مهم است. با ارائه جزئیات مختصر در مورد محتوای PDF، فراداده استخراج شده تجربه کاربر را بسیار بهتر می کند. این به کاربران کمک می کند تا به راحتی اسناد را شناسایی و با آنها کار کنند. به طور کلی، استخراج فراداده PDF مزایای بسیاری از جمله مدیریت سند کارآمدتر، گزینه های جستجوی بهبود یافته، انطباق با استانداردها و تجربه کاربری بهبود یافته به طور کلی به همراه دارد. فراداده ها را از PDF از طریق Aspose استخراج کرده و تمام وظایف لازم را در کار با داده ها حل کنید. برای استخراج فراداده از فایل های PDF، از API Aspose.PDF for Java استفاده خواهیم کرد که یک API تبدیل غنی از ویژگی، قدرتمند و آسان برای پلت فرم جاوا است. شما می توانید آخرین نسخه آن را مستقیماً از Maven دانلود کرده و آن را در پروژه مبتنی بر Maven خود با اضافه کردن تنظیمات زیر به pom.xml نصب کنید.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

فراداده PDF را از طریق Java استخراج کنید


شما نیاز به Aspose.PDF for Java به سعی کنید کد در محیط شما.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. دریافت documentInfo با استفاده از اموال Document.Info. ۱. دسترسی و نمایش خواص مختلف Document.Info.

قطعه کد Java ارائه شده نحوه استخراج فراداده از PDF توسط کتابخانه Aspose.PDF را نشان می دهد. یک فایل PDF به نام ‘GetFileInfo.pdf’ را باز می کند که در دایرکتوری مشخص شده توسط متغیر ‘DIR_INPUT_METADATA’ قرار دارد. کد جزئیات مختلفی را از سند با استفاده از تابع ‘info’ بازیابی می کند. اطلاعات فراداده خاصی را از PDF مانند نام نویسنده، تاریخ ایجاد، کلمات کلیدی، تاریخ اصلاح، موضوع و عنوان نمایش می دهد. کد از تابع «چاپ» برای نشان دادن این اطلاعات استفاده می کند. این قطعه کد یک مثال ساده از چگونگی استفاده از کتابخانه یا چارچوب Aspose.PDF برای استخراج فراداده از فایل PDF است.

استخراج فراداده PDF - Java

این کد نمونه نحوه استخراج اطلاعات فراداده فایل PDF را نشان می دهد

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());