fbpx
< 戻る
印刷

コマンドラインで PDF からメタデータを抽出する

JPedal は、PDF からメタデータを JSON オブジェクトとして抽出して再利用できます。

次のコマンド ライン コマンドを使用して、このデータのすべてまたは一部のみをファイルから任意の順序で抽出できます。

				
					java -jar jpedal.jar --metadata filename.pdf [metaDataType]...
				
			

この方法でアクセスできるデータとmetaDataTypeは以下のとおりです。

  • ドキュメントメタデータフィールド – fields
  • メタデータ XML – xml
  • ページ サイズ データ – pagesizes
  • ドキュメントのブックマーク/概要 – outline
  • ドキュメントフォントリスト – fonts
  • ドキュメントのページ数 – pagecount

metaDataType の有効な値は、スペース文字で区切られた上記の太字の値の任意の組み合わせです。1 つのコマンドに対して同じタイプを複数回リクエストしても、出力されるのは 1 回だけです。

値が設定されていない場合、 metaDataType のデフォルトのオプションは完全なリストです。

データのパイプ処理

得た情報を別の場所で使用するために保存したい場合は、バッチまたは bash スクリプトでパイプを使用して、次のように出力をファイルにパイプすることができます。

				
					java -jar jpedal.jar --metadata filename.pdf > output.txt
				
			

この機能は JPedal PDFUtilities クラスを使用します。

    メニュー
    PAGE TOP