PDFに関するトリビア ~PDFを正しく理解してますか~

PDFについての誤解

 2024年11月のJIIMAデジタルドキュメントでは、JIIMA標準化戦略委員会の講演の中で、よくあるPDFについて5つの誤解が紹介されました。今回は、このうち文書情報マネージャー認定セミナー参加者の中でも知らない方が多かった1、2、3について取り上げます。

1.画像のみ扱うことができる

2.PDFファイルは編集できない

3.受領したPDFファイルからデータを抽出するにはOCRするしかない

4.PDFの仕様はAdobeが決めている

5.長期保存が主な用途

PDFは画像のみ扱うことができる

 これは、普段の業務で、紙文書を多くスキャンして使っている人にみられる傾向があります。
 PDFには、「文書 PDF」 と「画像 PDF」があります。

 「画像 PDF」とは、紙文書などをスキャナーで読み取り、PDF 形式に変換した電子化文書のことを指します。他方、「文書 PDF」というタイプもあります。これは、オフィス文書(Word、PowerPoint、Excelなど)を PDF 形式に変換した電子文書のことを指します。

 普段、紙文書に接しない方もおり、そのような方にとって「画像 PDF」はあまり意識がなく、PDFと言えば「文書 PDF」を思い浮かべるようです。

PDFファイルは編集できない

 多くの方がこのような認識を持ってます。しかしながら、実はAdobeAcrobatProなどの編集ソフトウェアを使うことで編集が可能なのです。ただ、このようなソフトを利用している方が少ないことから、このような誤解は生じていると思います。

 職場の業務性質によりますが、一般的な業務ではこのような編集ソフトを使うことがないので、PDFファイルは編集されないという運用もあると思います。ただ、それは性善説の上に成り立っています。悪意がある場合は、編集できるので改ざんもできます。

■受領したPDFファイルからデータを抽出するにはOCRするしかない

 「画像 PDF」の場合はこれは正しいですが、「文書 PDF」の場合はPDFを作成する元のなったオフィス文書からテキストデータも引き継いでいます。ですのでわざわざOCRをする必要はありません。

どうですか、誤解はなかったですか。

いかがですか、皆さんも自部門のレベルアップのために、文書情報マネージャー認定セミナーを受講して、基本から応用までを学びませんか。募集要項はこちら。

自治体向け公文書管理セミナーを2025年7月から開催します。デジタル時代を迎えて紙文書から電子文書へ、変革を支えるセミナーです。詳しくはこちら。