2つの簡単な手順を使用して、PDFをODTに変換できます。まず、 Aspose.PDF for Java を使用してPDFファイルをDOCにレンダリングする必要があります。その後、強力なドキュメント処理API Aspose.Words for Java を使用して、DOCをODTに変換できます。どちらのAPIも、 Aspose.Total for Java パッケージに含まれています。
PDFをODTに変換するJavaAPI
変換要件
Maven ベースのプロジェクトから直接Aspose.Total for Javaを簡単に使用できます Aspose.PDF for Java と Aspose.Words for Java あなたのpom.xmlの。
または、 ダウンロード からZIPファイルを取得することもできます。
// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC
document.save("DocOutput.doc", SaveFormat.DOC);
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.ODT
outputDocument.save("output.odt", SaveFormat.ODT);
変換要件
PDFをODTに変換している間、ドキュメントがパスワードで保護されている場合でも、PDF Manipulation API Aspose.PDF for Java を使用してドキュメントを開くことができます。暗号化されたファイルを開くには、 Document オブジェクトを作成し、所有者のパスワードを使用してPDFを開く必要があります。
// open encrypted document
Document document = new Document("input.pdf", "password");
// save PDF as a DOC
document.save("DocOutput.doc", SaveFormat.DOC);
Javaを介してパスワードで保護されたPDFドキュメントを開く
入力ドキュメントをODTファイル形式で保存するときに、ファイルシステムの代わりにデータベースにドキュメントを保存することもできます。データベースとの間でDocumentオブジェクトの保存と取得を実装する必要がある場合があります。これは、任意のタイプのコンテンツ管理システムを実装する場合に必要になります。 ODTをデータベースに保存するには、多くの場合、ドキュメントをシリアル化してバイト配列を取得する必要があります。これは、 Aspose.Words for Java APIを使用して実行できます。バイト配列を取得したら、SQLステートメントを使用してデータベースに格納できます。
public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
// create an output stream which uses byte array to save data
ByteArrayOutputStream aout = new ByteArrayOutputStream();
// save the document to byte array
doc.save(aout, SaveFormat.ODT);
// get the byte array from output steam
// the byte array now contains the document
byte[] buffer = aout.toByteArray();
// get the filename from the document.
String fileName = doc.getOriginalFileName();
String filePath = fileName.replace("\\", "\\\\");
// create the SQL command.
String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
Statement statement = mConnection.createStatement();
statement.executeUpdate(commandString);
}
PDF の変換オプションを Java で探索
PDF ファイル形式とは
PDF (Portable Document Format) は、さまざまなソフトウェア アプリケーション、ハードウェア デバイス、オペレーティング システム間で一貫性を保った方法でドキュメントを表示するために設計されたファイル形式です。各 PDF ファイルには、テキスト、フォント、グラフィックス、および正確な表示に必要なその他の情報を含む、固定レイアウト ドキュメントの包括的な説明が含まれています。 PDF は、1990 年代初頭に Adobe Systems によって最初に開発され、テキストの書式設定やインライン画像を保持しながらコンピュータ ドキュメントを共有する手段として機能しました。
PDF ファイルは、通常、Adobe Acrobat などのソフトウェアや類似の PDF 作成ツールを使用して生成されます。現在、PDF は国際標準化機構 (ISO) によって管理されるオープン標準となっています。この標準化により、さまざまなプラットフォームやシステム間での互換性と相互運用性が確保されます。 PDF ファイルを表示するには、Adobe Reader やその他の PDF ビューアなどの無料ソフトウェアを利用できます。
PDF の大きな利点の 1 つは、プラットフォームに依存しないため、さまざまなデバイスやデバイスでシームレスに表示および印刷できることです。オペレーティングシステム。使用されるハードウェアまたはソフトウェアに関係なく、ドキュメントのレイアウトとコンテンツはそのまま残ります。この普遍的なアクセシビリティにより、さまざまなプラットフォームやシステム間でドキュメントを共有および配布するための推奨形式として PDF が人気を博しました。
テキスト、フォント、グラフィックス、書式設定を含む完全なドキュメントをカプセル化する PDF の機能により、さまざまな用途に信頼できる選択肢です。重要なレポートの共有、電子書籍の出版、フォームの配布、プロフェッショナルなプレゼンテーションの配信など、PDF を使用すると、さまざまな環境にわたって一貫したドキュメントのレンダリングとコンテンツの信頼性の高い保存が保証されます。
ODT ファイル形式とは
ODT は、Open Document Format (ODF) でドキュメントを保存するために使用されるファイル形式です。 ODT は Open Document Text の略です。これは、LibreOffice、OpenOffice、Apache OpenOffice などのアプリケーションで作成されるワープロ ドキュメントのデフォルトのファイル形式です。
ODT ファイルは、データの整理と構造化に使用されるマークアップ言語である XML に基づいています。これらは、オープンで相互運用可能な形式になるように設計されており、ユーザーはさまざまなソフトウェア アプリケーションやプラットフォーム間でドキュメントを作成、編集、共有できます。
ODT 形式は、Word で一般的に見られる幅広い機能と書式設定オプションをサポートしています。書類の処理。これには、テキスト スタイル、段落、表、画像、ハイパーリンク、ヘッダーとフッター、脚注などのサポートが含まれます。 ODT ファイルには、埋め込みオブジェクトやマルチメディア要素を含めることもできます。
ODT 形式の主な利点の 1 つは、さまざまなソフトウェア アプリケーションとの互換性です。ユーザーは、書式設定やコンテンツを失うことなく、あるワープロ アプリケーションで ODT ドキュメントを作成し、それを別のアプリケーションで開くことができます。これにより、コラボレーションが促進され、異なるソフトウェアを使用しているユーザーがドキュメントにアクセスして編集できるようになります。
ODT ファイルは、Microsoft Word の DOCX 形式や PDF などの他の一般的なドキュメント形式に簡単に変換でき、より幅広い用途に使用できます。互換性と共有の目的。さらに、ODT 形式は将来性があるように設計されており、ドキュメントの長期保存とアクセスが可能です。