Javaを介してPDFをODTに変換する

オンプレミスのJavaAPIを使用して、サードパーティのアプリケーションを使用せずにPDFをODTにレンダリングする

 

2つの簡単な手順を使用して、PDFをODTに変換できます。まず、 Aspose.PDF for Java を使用してPDFファイルをDOCにレンダリングする必要があります。その後、強力なドキュメント処理API Aspose.Words for Java を使用して、DOCをODTに変換できます。どちらのAPIも、 Aspose.Total for Java パッケージに含まれています。

PDFをODTに変換するJavaAPI

  1. Document クラスを使用してPDFファイルを開きます
  2. save 方法
  3. Aspose.Wordsの Document クラスを使用してDOCファイルをロードします。
  4. save メソッドを使用してドキュメントをODT形式で保存し、ODTを設定しますSaveFormatとして

変換要件

Maven ベースのプロジェクトから直接Aspose.Total for Javaを簡単に使用できます Aspose.PDF for JavaAspose.Words for Java あなたのpom.xmlの。

または、 ダウンロード からZIPファイルを取得することもできます。

// load PDF file with an instance of Document class
Document document = new Document("template.pdf");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC); 
// load DOC with an instance of Document
Document outputDocument = new com.aspose.words.Document("DocOutput.doc");
// call save method while passing SaveFormat.ODT
outputDocument.save("output.odt", SaveFormat.ODT);   

変換要件

PDFをODTに変換している間、ドキュメントがパスワードで保護されている場合でも、PDF Manipulation API Aspose.PDF for Java を使用してドキュメントを開くことができます。暗号化されたファイルを開くには、 Document オブジェクトを作成し、所有者のパスワードを使用してPDFを開く必要があります。

// open encrypted document
Document document = new Document("input.pdf", "password");
// save PDF as a DOC 
document.save("DocOutput.doc", SaveFormat.DOC);

Javaを介してパスワードで保護されたPDFドキュメントを開く

入力ドキュメントをODTファイル形式で保存するときに、ファイルシステムの代わりにデータベースにドキュメントを保存することもできます。データベースとの間でDocumentオブジェクトの保存と取得を実装する必要がある場合があります。これは、任意のタイプのコンテンツ管理システムを実装する場合に必要になります。 ODTをデータベースに保存するには、多くの場合、ドキュメントをシリアル化してバイト配列を取得する必要があります。これは、 Aspose.Words for Java APIを使用して実行できます。バイト配列を取得したら、SQLステートメントを使用してデータベースに格納できます。

public static void StoreToDatabase(Document doc, Connection mConnection) throws Exception {
    // create an output stream which uses byte array to save data
    ByteArrayOutputStream aout = new ByteArrayOutputStream();
    // save the document to byte array
    doc.save(aout, SaveFormat.ODT);
    // get the byte array from output steam
    // the byte array now contains the document
    byte[] buffer = aout.toByteArray();
    // get the filename from the document.
    String fileName = doc.getOriginalFileName();
    String filePath = fileName.replace("\\", "\\\\");
    // create the SQL command.
    String commandString = "INSERT INTO Documents (FileName, FileContent) VALUES('" + filePath + "', '" + buffer + "')";
    Statement statement = mConnection.createStatement();
    statement.executeUpdate(commandString);
}  

PDF の変換オプションを Java で探索

PDF を ODP に変換 (OpenDocument プレゼンテーション形式)
PDF を OTP に変換 (OpenDocument標準フォーマット)
PDF を POTM に変換 (Microsoft PowerPoint テンプレート ファイル)
PDF を POTX に変換 (Microsoft PowerPoint テンプレートのプレゼンテーション)
PDF を POT に変換 (Microsoft PowerPoint テンプレート ファイル)
PDF を POWERPOINT に変換 (プレゼンテーションファイル)
PDF を PPSM に変換 (マクロを有効にしたスライド ショー)
PDF を PPSX に変換 (PowerPoint スライド ショー)
PDF を PPS に変換 (PowerPoint スライド ショー)
PDF を PPTM に変換 (マクロが有効なプレゼンテーション ファイル)
PDF を PPT に変換 (パワーポイントによるプレゼンテーション)
PDF を SWF に変換 (ショックウェーブフラッシュムービー)
PDF を XAML に変換 (XAMLファイル)
PDF を APNG に変換 (アニメーション化されたポータブル ネットワーク グラフィックス)
PDF を DICOM に変換 (医療におけるデジタル イメージングと通信)
PDF を DXF に変換 (Autodesk 図面交換フォーマット)
PDF を EMZ に変換 (Windows 圧縮拡張メタファイル)
PDF を IMAGE に変換 (画像ファイル)
PDF を JPEG2000 に変換 (J2K画像フォーマット)
PDF を PSD に変換 (Photoshop ドキュメント)
PDF を SVGZ に変換 (圧縮されたスケーラブルなベクター グラフィックス)
PDF を TGA に変換 (Truevision グラフィックス アダプター)
PDF を WMF に変換 (Windows メタファイル)
PDF を WMZ に変換 (圧縮された Windows メタファイル)
PDF を CSV に変換 (カンマ区切りの値)
PDF を DIF に変換 (データ交換フォーマット)
PDF を DOCM に変換 (Microsoft Word 2007 マルコ ファイル)
PDF を DOTM に変換 (Microsoft Word 2007+ テンプレート ファイル)
PDF を DOTX に変換 (Microsoft Wordテンプレートファイル)
PDF を DOT に変換 (Microsoft Wordテンプレートファイル)
PDF を EXCEL に変換 (スプレッドシートのファイル形式)
PDF を FLATOPC に変換 (Microsoft Word 2003 ワードプロセッサML)
PDF を FODS に変換 (OpenDocument フラット XML スプレッドシート)
PDF を GIF に変換 (グラフィカル交換フォーマット)
PDF を MARKDOWN に変換 (軽量マークアップ言語)
PDF を MD に変換 (マークダウン言語)
PDF を ODS に変換 (OpenDocument スプレッドシート)
PDF を OTT に変換 (OpenDocument テンプレート)
PDF を PCL に変換 (プリンターコマンド言語)

PDF ファイル形式とは

PDF (Portable Document Format) は、さまざまなソフトウェア アプリケーション、ハードウェア デバイス、オペレーティング システム間で一貫性を保った方法でドキュメントを表示するために設計されたファイル形式です。各 PDF ファイルには、テキスト、フォント、グラフィックス、および正確な表示に必要なその他の情報を含む、固定レイアウト ドキュメントの包括的な説明が含まれています。 PDF は、1990 年代初頭に Adobe Systems によって最初に開発され、テキストの書式設定やインライン画像を保持しながらコンピュータ ドキュメントを共有する手段として機能しました。

PDF ファイルは、通常、Adobe Acrobat などのソフトウェアや類似の PDF 作成ツールを使用して生成されます。現在、PDF は国際標準化機構 (ISO) によって管理されるオープン標準となっています。この標準化により、さまざまなプラットフォームやシステム間での互換性と相互運用性が確保されます。 PDF ファイルを表示するには、Adobe Reader やその他の PDF ビューアなどの無料ソフトウェアを利用できます。

PDF の大きな利点の 1 つは、プラットフォームに依存しないため、さまざまなデバイスやデバイスでシームレスに表示および印刷できることです。オペレーティングシステム。使用されるハードウェアまたはソフトウェアに関係なく、ドキュメントのレイアウトとコンテンツはそのまま残ります。この普遍的なアクセシビリティにより、さまざまなプラットフォームやシステム間でドキュメントを共有および配布するための推奨形式として PDF が人気を博しました。

テキスト、フォント、グラフィックス、書式設定を含む完全なドキュメントをカプセル化する PDF の機能により、さまざまな用途に信頼できる選択肢です。重要なレポートの共有、電子書籍の出版、フォームの配布、プロフェッショナルなプレゼンテーションの配信など、PDF を使用すると、さまざまな環境にわたって一貫したドキュメントのレンダリングとコンテンツの信頼性の高い保存が保証されます。

ODT ファイル形式とは

ODT は、Open Document Format (ODF) でドキュメントを保存するために使用されるファイル形式です。 ODT は Open Document Text の略です。これは、LibreOffice、OpenOffice、Apache OpenOffice などのアプリケーションで作成されるワープロ ドキュメントのデフォルトのファイル形式です。

ODT ファイルは、データの整理と構造化に使用されるマークアップ言語である XML に基づいています。これらは、オープンで相互運用可能な形式になるように設計されており、ユーザーはさまざまなソフトウェア アプリケーションやプラットフォーム間でドキュメントを作成、編集、共有できます。

ODT 形式は、Word で一般的に見られる幅広い機能と書式設定オプションをサポートしています。書類の処理。これには、テキスト スタイル、段落、表、画像、ハイパーリンク、ヘッダーとフッター、脚注などのサポートが含まれます。 ODT ファイルには、埋め込みオブジェクトやマルチメディア要素を含めることもできます。

ODT 形式の主な利点の 1 つは、さまざまなソフトウェア アプリケーションとの互換性です。ユーザーは、書式設定やコンテンツを失うことなく、あるワープロ アプリケーションで ODT ドキュメントを作成し、それを別のアプリケーションで開くことができます。これにより、コラボレーションが促進され、異なるソフトウェアを使用しているユーザーがドキュメントにアクセスして編集できるようになります。

ODT ファイルは、Microsoft Word の DOCX 形式や PDF などの他の一般的なドキュメント形式に簡単に変換でき、より幅広い用途に使用できます。互換性と共有の目的。さらに、ODT 形式は将来性があるように設計されており、ドキュメントの長期保存とアクセスが可能です。