PHP の PDF からテキストを抽出
{{製品名}} を使って PDF からテキストを抽出する方法
PHP via Java の Aspose.PDF を使って PDF からテキストを抽出する方法
テキスト PDF ファイルを抽出するには、php-java プラットフォーム向けの機能豊富で強力で使いやすいドキュメント操作 API である Aspose.PDF for .NET API を使用します。NuGet パッケージマネージャーを開き、Aspose.PDF を検索してインストールします。パッケージマネージャーコンソールから以下のコマンドを使用することもできます。
PHP の PDF からテキストを抽出
ご使用の環境でコードを試すには Aspose.PDF ライブラリ が必要です。
- PDF に Document のインスタンスをロードします。
- TextAbSorber オブジェクトを作成してテキストを抽出します。
- すべてのページにアブソーバーを取り付けてください。
- 抽出したテキストを取得
- ライターを作成してファイルを開き、そのファイルにテキストを 1 行書き込む
PHP を使って PDF からテキストを抽出する
このサンプルコードは、PDF ドキュメントからテキストを抽出する方法を示しています。
Input file:
File not added
Output format:
PDF
Output file: