コラム / 画像フォーマット / 第1章

HOME 研究室概要 コラム 周辺探索 メンバー 掲示板 リンク

第1章 圧縮の必要性

 現在インターネットは幅広く普及していますね。特にWWWなどは多くの人々にとって手軽に利用され、WWW上での情報収集、情報発信、意見交換などが多く行われるようになりました。

 WWWでは楽しさや、見やすさ向上のために画像が必需品となっています。画像を一切使用していないWebコンテンツはあまり見かけることはありません。しかし、画像情報は文字情報と比べてかなりサイズが大きいため、インターネットで使用するためには画像サイズを小さくしてやらなければなりません。

 つまり、インターネット上では画像を何らかの形で圧縮するということが必要になってくるのです。

 このページの目次

1.1節 文字との情報量の比較
1.2節 圧縮の概念
1.3節 画像圧縮の技術

 1.1節 文字との情報量の比較

 文字は日本語1文字あたり2バイトの容量を使用します。ですから1000文字程度の文章なら2キロバイトのデータとなります。

 圧縮していない画像はフルカラー(1677万色)ですと、1ピクセルあたり3バイト使用します。ですから256×256ピクセルの圧縮していない画像では

3×256×256=196608 (バイト)

のサイズになります。

 文字情報は1文字あたり2バイトですから、84804文字つまり400字詰め原稿用紙212枚と同じサイズです。

= 原稿用紙212枚(84804文字)の
文字情報

図.1: 画像と文字の情報量の比較

 つまり、圧縮していない画像情報は思いのほかサイズが大きいのでWWWで利用する場合、圧縮する必要があります。それにしても画像のデータの大きさにビックリしますね。

 1.2節 圧縮の概念

 実は圧縮していない画像データには真の情報と余分な情報のごちゃ混ぜのようになっているのです。ですからそのなかから真の情報のみを取り出し、余分な部分を捨ててしまえば良いわけです。

 例えば

「111111111111110000000000111111111111111」

のようなデータは

「1が14個、0が10個、1が15個」

といった具合に置き換え、さらに最初は1、データは1か0だけだと分かっていれば

「14,10,15」

で最初のデータと同じ意味を持つことになり圧縮が行われたことになります。

 1.3節 画像圧縮の技術

 圧縮を行う場合、文書などは完全にもとの情報に復元できないと困りますが、一般の画像の場合では完全に元の画像に復元する必要がありません。そのため画像圧縮では情報の一部を削減し、もとの情報に復元できない代わりに圧縮率を各段に高めるといった方法(図.2)をとっています。これを非可逆圧縮といいます。

非可逆圧縮のモデル

図.2: 非可逆圧縮のモデル

 あなたは、左のマルの状態を正しく他人に説明できますか? それに比べて、右のマルは、すぐ説明できるはずです、「きれいな円」だと。つまり、右のマルの方が、情報量が少なくなっていることを意味しています。

 また、人間の目による認識では画像中の細かい変化は大まかな変化に比べてあまり重要でないため、削減しても大して復元画像に影響を与えません。そこでJPEGでは画像を周波数分解し、得られた成分の中から細かい変化(高周波成分)を削減することで高圧縮を実現しています。

 このように、最近の画像フォーマットでは、さまざまな圧縮をすることで、画像ファイルがあまり大きくならないような仕組みになっています。

ページの上へ 上のページへ 次の章へ


企画・製作 村上・泉田研究室 HP製作委員会(2001)
ご意見・お問い合わせは、こちら までどうぞ。