-
はじめに
-
JPedalを実行する
-
JPedalの使い方
-
機能
-
JPedal Viewer
- JPedalのBase ViewerでPDFを見る
- カスタマイズ可能なビューアでのPDFファイルを表示する
- JavaのコードからPDF Viewerの機能にアクセス
- Java PDF Viewerでユーザーインターフェイスをカスタマイズ
- ビューアにオブジェクトを描画
- JavaアプリケーションにPDFビューアを追加する方法
- ビューアの機能をカスタマイズする
- JPedalインスペクタでPDFファイルの内容を検査
- PDFビューアの通知ポップアップを独自のものに置き換える
- JPedal のアクセシビリティオプション
- Java PDF Viewerを使ってポートフォリオファイルを表示
- Java PDF Viewerでテキストを選択
- JPedal ViewerはJavaFXで使用できますか?
- JPedal ViewerはSWTで使用できますか?
- JPedal ビューアでダークモードを設定する
- 線の太さを非表示にする
- すべての記事を表示 ( 1 ) 記事を折り畳む
-
テキスト関連
-
画像への変換
-
画像の抽出
-
PDF画像変換のWebサービスAPI
-
フォームについて
-
PDFの注釈(アノテーション)
-
PDFの操作
-
印刷について
-
メタデータ
-
フォントについて
-
JPedalをクラウド上で実行する
-
アップデート情報
< 戻る
印刷
PDFファイルから文書の目次(しおり)を抽出する
作成日2024年1月30日
最終更新日2024年1月30日
JPedalは、PDFファイルからテキストコンテンツを抽出するためのいくつかの方法を提供します。PDFファイルは、オプションのDocument outlineオブジェクトを含むことができます。これは目次(しおり)であり、タイトルやリンクページを含むことができ、ズームや正確な表示領域をコントロールすることができます。これが存在する場合、このコードはアウトラインデータオブジェクトをXMLファイルに抽出します。このケースでは、ファイルから文書の目次を抽出します。目次がない場合、ファイルは作成されません。
コマンドラインまたは他の言語でPDFから目次(しおり)を抽出する
java -jar jpedal.jar --metadata "pdfFile.pdf" outline
これは、アウトラインデータをJSONオブジェクトの文字列としてコンソールに出力します。
APIメソッドにアクセスする例
ExtractOutline extract=new ExtractOutline("C:/pdfs/mypdf.pdf");
//extract.setPassword("password");
if (extract.openPDFFile()) {
Document pdfOutline=extract.getPDFTextOutline();
}
extract.closePDFfile();
JavaでPDFから目次(しおり)を抽出
ExtractOutline.
writeAllOutlinesToDir("inputFileOrDirectory", "outputDir");
この例ではJPedal ExtractOutlineクラスを使用しています。ExtractOutlineは、タイトル、ページ、初期ズームレベルなど、アウトラインエントリに関する様々な詳細を含むPDFごとのXMLファイルを出力します。