平成23年10月21日(金):初稿 |
○「お客様への事件経過報告-紙ベースからPDFファイルへ」記載の通り、現在、PDFファイルについて最も関心を持っておりますが、それが如何なるものか、サッパリ、判っていません。以下、ウィキペディアでの解説Portable Document Formatからの抜き書き備忘録です。 PDFとは Portable Document Format (ポータブル・ドキュメント・フォーマット)の略称で、アドビシステムズが開発および提唱する、電子上の文書に関するファイルフォーマットで、2008年7月には国際標準化機構によってISO 32000-1として標準化された。 PDFの特長 作成したドキュメントを異なる環境のコンピュータで元のレイアウトどおりに表示・印刷できることで、印刷物と同じレイアウトの電子ドキュメントを公開するために利用され、Adobe Readerなどがインストールされた環境であれば、一般のHTMLファイルと同様にWebブラウザ上で閲覧できる。 さらに、 ドキュメントのセキュリティを設定できる 圧縮してデータを格納し、ファイルサイズを小さくできる しおり・リンク・コメント・注釈といった、ドキュメントを画面に表示するときに便利な機能を設定できる フォーム機能を使って、利用者の入力欄を受け取るような書式設定済み文書を作成できる 等の特長もある。 PDFファイルの表示と印刷 Windows環境におけるPDFファイルの表示や印刷には、アドビシステムズ社から無料で配布されているAdobe Readerを使うのが一般的で、Acrobatがインストールされている場合は、これでも表示や印刷ができる。Mac OS XではOSに標準で付属する「プレビュー」を利用でき、その他のOSについても、PDF閲覧ソフトに付属している印刷機能や、OSの印刷機能を利用して印刷できる場合が多い。 紙資料のイメージPDF化 紙資料をイメージスキャナなどを使って電子ドキュメントにする場合も、PDFが利用されることが多い。 紙資料を電子ドキュメント化するとき、PDFを利用しない場合には、TIFFなどの画像ファイルとして保存する方法と、OCRソフトウェアを使ってテキストとして保存する方法がある。 PDFのテキスト化 画像ファイルとして保存された電子ドキュメントは画面上で見る場合には紙資料と同じ内容が再現できるものの、文章や文字をコピーすることができないなどテキストの再利用に大きな制限がある。また、OCRソフトウェアを使って作成したテキストファイルではテキストの再利用は可能となるが、OCRソフトウェアの精度の問題もあり、元の内容を完全に再現できない場合が多い。 PDFを利用すれば、紙資料をスキャンした画像の上にOCRソフトウェアで変換して作成した透明テキストを重ね、1つのファイルとして保存することができる。こうしたPDFのドキュメントでは、画面上で見る場合には紙資料の内容を完全に再現でき、不完全ではあるがテキストの再利用もできる。例えば、Acrobatにはバージョン6.0以降のStandard版以上でOCR機能が標準で搭載されるようになった。 以上:1,301文字
|