Scribble at 2026-06-30 10:45:20 Last modified: 2026-06-30 11:02:32

添付画像

PDF: Still Unfit for Human Consumption, 20 Years Later

この話題を取り上げる経緯を説明しておく。もともとは Hacker News で紹介されていた話題として、".self" という TLD を提案しているサイトの話があり、そのサイトで ".self" という TLD についてドキュメントを PDF として公開したら、「human-centered なウェブという理念を掲げるドキュメントを PDF で公開するとは皮肉なことだ」というコメントがついていた。そのコメントには、「そんな茶々入れが議論に何の関係があるのか?」というリプライが付いていたのだけれど、いやいや関係あるだろうという別の人物がポイントしていたのが、上のニールセンらの論説である。

まずニールセンらは、PDF はオンラインでの閲覧には不向きであり、20年以上にわたるユーザビリティ研究でも問題点がまったく改善されていない(PDF を表示する側のデバイスにおいても、それから PDF という文書フォーマットにおいても)。よって、Web で情報提供する際は、PDF ではなく HTML ページを使うべきであると主張する。もちろん、僕も同感だ。特に地方自治体が公表文書をやたらと PDF でフォーマットしたがる傾向は、どういうコンサルや IT ゼネコンにそそのかされているのかは知らないが、あれは早急にやめるべきである。印刷物としての固定した判型での体裁にこだわるべきではなく、公の文書で発表される「内容」が、そのようなビジュアル・デザインという些末で非本質的な(これは、敢えてプロのデザイナーとして言わせてもらう)条件に制約されてはならない。イラストの下に文章が入りきらないから、説明を簡単にしようなどという動機で行政文書を書いたり調整しているとすれば、それは国民に対するデザインや編集という名の背任行為である。これも、敢えて雑誌編集者だった経歴がある人間として言わせてもらう。このように、デザインや編集の可能性だけでなく、法令や認知能力や概念など色々な観点での限界や節度を正確に理解していることが、芸術家ならぬデザイナーとして他人からお金をもらって仕事をする資格があるかどうかの要件である

さて、では PDF フォーマットの文書にはどのような欠点があるのか。簡単にニールセンらが列挙している項目を抜き出しておこう。

1. 線形で読みづらい:印刷前提で作られた長文の塊になりやすく、ウェブ向けの書き方・アクセシビリティが欠如している。

2. ウェブ・ページと異なるUIで混乱を招く:見た目・操作性がウェブ・ページと異なり、ユーザーが迷いやすい。

3. 読み込みが遅い:特にモバイルや低速環境でストレスが大きい。有料版へ移行させる前提で機能制限版として無料でバラまかれている Adobe Reader などは、ドキュメントを読み込む以前に重すぎて起動すらしないこともある。

4. 情報が整理されていない:チャンク化・見出し・箇条書きなど、ウェブの標準的な可読性にかかわる改善手法が使われない。

5. 方向感覚を失わせる:ナビゲーションがなく、タブの挙動も分かりづらい。

6. 内部ナビゲーションが弱い:目次があっても役に立たず、目的の情報に辿り着くのが困難である。

7. 紙サイズ前提で画面に合わない:モバイルでは特に読みづらく、拡大・スクロールが必須になる。

ただし、これらの指摘に疑問の余地はある。たとえば、僕はニールセンらのエディトリアル・デザインという考え方に簡単には賛成しかねる。ウェブのコンテンツだからといって、チャンクだらけの簡単なフレーズだけで文章を表現したり、やたらと箇条書きを濫用するのは、"editorial design" というよりも読み手に対する過剰サービスや通俗化・短絡化であり、表現そのものだけでなく表現しようとする内容まで「バカ専用」に最適化するような(悪い意味での)マーケティングや SEO でしかないと思う。コンテンツなり文章というものの表現あるいは構成には独自の規則性なり目的なり基準があって、それらはウェブ・コンテンツとして特定のデバイスで読みやすいかどうかという短絡的なユーザビリティという基準で改められてよいとは限らないものである。もっと言えば、編集という作業は、たとえアクセシビリティのような基準による変更すら「暴力」となりうるということを自覚する必要があるのだ(単に障碍者のためと称して批判を受け付けない崇高な善行であるかのようにアクセシビリティを扱うのは、それこそ X などで当事者でもないのに騒いでいる「正義マン」みたいなものだ)。

それに、ニールセンらの列挙には重大な問題が背後に隠れているというのに、PDF を語るための条件であるからなのかスルーされてしまっていて、敢えて指摘されないままとなってしまっていることにも疑問がある。それは、(少なくともブラウザにリーダが実装されていなかった頃は)そもそも PDF 文書を読むには専用のソフトウェアが必要であることだ。

ウェブは、まさにウェブ・ページをソースとしてホストしたり、コンテンツとしてネットワーク通信でやりとりするために発展してきたのであるから、ウェブのコンテンツを利用するためのツールなりデバイスとしてコンピュータなりターミナルなりブラウザがあるということまでは許容できるだろう。しかし、Adobe Reader が必須だと言われると、おいそれは違うだろうという話になる。行政文書ならなおさらだ。これは酷い話だが、どうして PDF なのかという問いに、どこで見たかは忘れたが「改竄防止になる」などと極めつけの愚かな回答をした役人がいたのを見たことがある。ウェブ・ページは攻撃されると簡単に改竄されてしまうらしく、それに比べて PDF は改竄しにくいそうだ。こんなホラ話を、いったいどこの IT ゼネコンの SE やコンサルが教えたのかは知らないが、いくらなんでも無知すぎる。

余談になるが、せっかくだから情報セキュリティの実務家が馬鹿の代わりに行政の諸君に指南しておいてあげよう。現実には、たいていの利用者は「元の文書のデザインや文言」なんて覚えていないので、そういうドキュメントをダウンロードするときは、初めて目にする文書をダウンロードするのである。したがって、それが元の文書とぜんぜん違うデザインと文書の PDF だったとしても(そもそも「元の文書」を見たことがないのだから)気づかない可能性が高いのだ。それが「改竄」であることが分かるのは、元の文書を知っている運営側だけだ。しかし、そういう文書を公開するときに最も大切な情報セキュリティとは、君ら運営側からみて改竄されていない事実のことなんだろうか。そうではない。こういう場合に最優先で守られるべきなのは、利用者にダウンロードされて伝達される情報なのである。そして、ウェブ・ページを外部から脆弱性を突かれて書き換えられるようなリスクがあるサーバとかコンテンツは、同じく外部から脆弱性を突かれて PDF ファイルを入れ替えられてしまうリスクがあるのと大差ないわけであって、PDF だから安全だというわけにはいかないのである。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る