PDFの1/60に軽量化できるHTML。PDFからHTMLに変換すれば簡単
結論から先にお知らせします―――ネットに載せるPDFの軽量化なら、PDF→HTML変換ツールを使って、HTMLに変換してサイトに載せるのがいちばん効果的です。
企業や役所がウェブで公開することが多く、一般の方が閲覧する機会が多い3パターンの文書について、PDFと、PDF→HTML変換したもので比較しました。その結果、PDFに比べてHTMLなら、最大で1/60(PDFの1.7%)にデータ量を削減することができました(下表)。
比較テストはPDFファイルと、PDF→HTML変換ツールBuildVu(ビルドビュー)で変換したHTMLで行ないました。具体的には、BuildVuにPDFファイルを入力すると、変換したHTMLファイル群(HTML、CSS、JavaScript、JSONなど)を出力します。これらPDFとHTMLのそれぞれで閲覧時のデータ量を集計しました。
BuildVuは、図面がズレない、複雑な雑誌のレイアウトも再現、縦書きやふりがな(ルビ)付きの日本語にも対応する高機能なPDF→HTML変換ツールです。BuildVuは、PDFのページごとにHTMLファイルを生成します。つまり閲覧しないページのデータをやり取りしないので、データ通信量の削減効果が高い特長があります。
簡単に変換できるの? そんなに圧縮できるの?
お持ちのPDFファイルをオンラインで変換できる評価用のウェブサービスを提供しています。メールアドレスなどを登録することなく、その場で変換結果を確認したりHTMLファイルをダウンロードできます。くわしくはこちらの記事をご覧ください。
PDFを廃止する必要はありません。PDFはファイルをPCなどに保存して閲覧や印刷する用途、主にオフライン用として提供します。ネットで閲覧するオンライン用にはHTMLという役割分担にします。
PDF対HTMLの比較テストについて、以下で詳しく解説します。
「PDF軽量化」、「PDF圧縮」、「PDFファイルサイズ縮小」とは?
PDFを取り扱っていると、わりとよく聞く言葉ですが、微妙にニュアンスが異なるようです。それぞれについて意味合いを整理しておきましょう。
PDF軽量化とは
- PDFのファイルの大きさ(ファイルサイズ、バイト数)を小さく・少なくすること
- PDFファイル内の不要な情報を取り除くこと
・旧バージョン向けのデータ、マルチメディア情報、添付ファイルなどを削除 - PDFファイルを開くまでの時間が少なくてすむようにPDFファイルを編集(加工)すること
・リニアライズドPDF化すると、一部のPDFビューアはPDFファイルの読み込み(ダウンロード)終了前に表示を開始
PDF圧縮とは
- PDFのファイルの大きさ(ファイルサイズ、バイト数) を小さく・少なくすること
- PDFファイル内の不要な情報を取り除くこと
・旧バージョン向けのデータ、マルチメディア情報、添付ファイルなどを削除
PDFファイルサイズ縮小とは PDFを小さくするとは
- PDFのファイルの大きさ(ファイルサイズ、バイト数) を小さく・少なくすること
いずれも、できるだけ早くダウンロードや読み込みが終えられるよう、バイト数を減らす対策を指していることがわかります。でもこれって、ネットでPDFを見る利用者のニーズとは微妙にズレているかもしれません。
ウェブ閲覧では、スマホとPDFは相性が悪い
取扱説明書や報告書のようなまとまった文書を公開するのにPDFは都合がよいので長らく使われてきました。しかしネットが普及し、閲覧者の過半数がスマホになったいま、PDFは時代に合わなくなっています。サイト制作者もその点に配慮して、手間がかかる対応をしています。
PDF閲覧へのスマホ利用者の不満
- 見るのは一部のページだけなのにPDFファイル全体をダウンロードしないといけない
- 見られるまでの待ち時間が長い
- 見ないページのためのギガ消費が激しい
サイト制作者の不満
- 章ごとに小分けしたPDF、場合によってはページごとのPDFに分割するのがたいへん
- 小分けPDFへのリンクを載せるHTMLページの制作が手間
サイト制作者が手間をかけてPDFの欠点を補う努力をしていますが、PDF閲覧者に十分な満足を提供できてはいません。サイト閲覧者の不満を根本的に解消できるようになるとも思えません。考え方を変えた方がよさそうです。
実のところ、閲覧者にはPDF規格へのこだわりはありません。「PDFを見たい」のではなく、PDF内の「情報が見たい」のです。PDFに限界を感じたら、もっとよい方法に替えてもかまわないのです。HTML5やSVGといった、比較的新しいHTML規格に移行しましょう。
チャレンジ? いえいえ、すでに実績はたくさんあります。電子出版や電子ブック(電子カタログ、デジタルブック)などの世界では広く使われています。すでにほとんどの方が気付かないうちに利用しているはずです。主要なWebブラウザは標準設定で対応済みで、一般の企業や役所でも手軽に使える時期になっています。これまでのPDF資産をHTMLに移行させるツールがBuildVuなのです。
ネット閲覧でよく見る文書で比較テスト
PDF対HTMLの比較の条件と、結果の分析について説明します。
評価に採用した文書は、役所のガイドブック、機器メーカーの取扱説明書、技術系の書籍の3パターンを選びました。ガイドブックと取扱説明書はネットで公開されているPDFを、書籍は著者から提供を受けた内容見本PDFを使用しました。それらをBuildVuでHTML5に変換しました(デフォルト状態、オプション指定なし)。
HTML閲覧のシナリオ①は、(a)文書の1ページを表示して→(b)サムネールを見て読みたいページを探して→(c)そのページを表示するという閲覧を想定しています。表紙から閲覧するときや、検索エンジンで見つけた文書を閲覧する際の流れになります。
シナリオ②は、特定のページを指定する「直リンク」のURLが指定されている想定です。見るべきページがわかっている際の閲覧の流れになります。
シナリオ①②のいずれも10ページ目を表示しました。
- 「東京くらし防災(英語版)」(東京都)
「東京くらし防災」の日本語版は、分割したPDFを用意して、コンパクトなPDF化への配慮をしていました。しかし外国語版は一括PDF(82ページ)だけだったので、評価の対象としました。その結果、パターン①でPDFに比べてHTMLは 4.3% 約1/23に圧縮、パターン②ではPDF比 1.7% 約1/60に圧縮と、大きな効果が得られました。案内するメニューページに分割PDFのリンクが多数ならぶと見にくくなりますが、HTML化ならスッキリわかりやすくできます。 - 「arrows Be4 Plus F-41B 取扱説明書」(docomo)
パターン①がPDFにくらべてHTMLは18.4% 約1/5に圧縮、パターン②ではPDF比 16.7% 約1/6に圧縮できました。220ページもある取扱説明書なので、ごく一部を見る大多数の人にメリットを提供できます。 - 「詳細! PHP 7+MySQL 入門ノート」お試しサンプル版(大重美幸)
ほぼ全ページに図表がある技術系の書籍の62ページ分です。パターン①がPDFにくらべてHTMLは14.6% 約1/7に圧縮、パターン②ではPDF比 9.5% 約1/11に圧縮できました。電子書籍でもオンラインで検索して一部を読むなら、PDFよりHTMLの方がデータ量を減らせるとわかりました。
なおHTML化してもデータ量が減らない場合もあります。代表例としては、①全ページを閲覧するような場合、②多くのフォントを組み込んでいる場合、③数ページといった小ボリュームの文書の場合です。①はページごとにサーバとのやり取りが増える分がムダになります。②は、PDFはフォントを圧縮して記録しますが、HTMLでは非圧縮なのが理由です。③は、コンテンツ部分のHTMLのデータを減らせても、ビューアプログラム(JavaScriptなど)のデータ量が増える分で帳消しになるからです。
企業や役所のみなさま、これまで築いてきたPDF資産を、BuildVuを使ってHTML化して再活用してみませんか? この分野の代表ともいえるPDF→HTML変換ツールBuildVuで、正確な変換と付属ビューアによる快適な閲覧をぜひご体感ください。ぜひ、お手持ちのPDFファイルをオンライン変換してご検討ください(無料。メールアドレスなどの登録は不要です。末尾の手順をご覧ください)。
BuildVuについて
BuildVuは、雑誌や図面などをHTML5/SVGで“見た目”どおりに表示するツールとして20年以上の実績があります。PDFからHTML5/SVGへの変換ツール、HTML5/SVGビューアは、ぜひBuildVuにお任せください。
PDFからHTML5/SVGへの変換入門は、こちらをご覧ください
ぜひ今すぐにBuildVuで、あなたのPDFファイルをHTML5に変換してみてください。変換と専用ビューアでの閲覧をこちらからお試しいただけます(メールアドレスの登録不要、無料です)。
BuildVuオンラインコンバーター※1
「オンラインでPDFからHTMLに変換」
※1 開発元のIDRsolutions社と株式会社インターワークの提供するサービスです。