コラム / 画像処理 / 第4章

HOME 研究室概要 コラム 周辺探索 メンバー 掲示板 リンク

第4章 2値化処理

 今まで例に挙げてきた画像は白黒画像ですが白黒画像といっても、白や黒だけでなくうすーい灰色や、濃いー灰色を使って表現しています。

 ここで、ある適当な2つの濃度値に濃度変換する処理のことを『2値化処理』といいます。画像を2値化するメリットとしては、対象とする画像と背景画像を切り離すという処理を簡単に行えるという点です。2値化は文字などを背景から引き離すときなどに有効です。

 このページの目次

4.1節 しきい値
4.2節 Pタイル法とモード法
4.3節 判別分析2値化法

 4.1節 しきい値

 2値化処理とは、ある濃度値より小さいものは濃度値をいくらに変更し、ある濃度値より大きいものは濃度値をいくらに変更するよ、といった濃度変換処理をします。 ここで濃度変換の分かれ目となる濃度値を、しきい値といいます。このしきい値の設定をかえるだけで、簡単にいろんな画像を得ることができます。

 具体的には、次のような変換を行います。あるしきい値をθ、ある座標系 (x , y ) の濃度値を f (x , y ) 、とりうる濃度値の最大値を 255 としたとき、変換後の濃度値 f ' (x , y ) は次式のようになります。

2値化処理

 また、2値化処理の考え方を図示すると図.17のようになります。

2値化処理の考え方

図.17: 2値化処理の考え方

 では、実際に2値化処理の例を紹介しましょう。これは、手書きの文字を背景と分ける例です。黒っぽい灰色は黒に、白っぽい灰色は白に濃度変換をして文字を目立たせています。(図.18,19を見て下さい。) ちなみにしきい値θは、167 としています。



図.18: 手書き文字画像 (128×128)


図.19: 2値化画像 (128×128)

 4.2節 Pタイル法とモード法

 2値化処理する時に、しきい値を決定することは、とても重要な役割を担っています。しきい値によって2値化した画像の善し悪しが決まってしまうからです。では、どうやって、しきい値を求めれば良いのでしょうか? ここでは、基本的な2つの方法を説明します。

『Pタイル法』

 本や新聞にかかれた文字を認識するような場合では、一定の面積の中での背景の占める面積と文字の占める面積との比率 p はだいたい決まっていると考えられます。そこで、画像全体の面積を S 、対象図形の面積を S0 とし画像全体に対する対象画像の面積の比率 p を求めます。

pタイル法1

 対象図形が背景よりも明るかったら、濃度値の大きい方から、対象図形が背景よりも暗かったら、濃度値の小さい方から画素数を数えていき、その画素数を N0 とします。全体の画素数を N とすると

pタイル法2

となるときの濃度値をしきい値とします。このように、Pタイル法は、画像の中の対象図形のおおよその面積が分かっているときに有効な方法です。

『モード法』

 画像の中の対象図形のおおよその面積がわからない場合でも、濃度ヒストグラムを作ってみると、多くの場合、双峰性のヒストグラムが得られます。このようなヒストグラムの場合は、その谷に当たる濃度値をしきい値とすれば良いのです。

双峰性ヒストグラムの谷

図.20: 双峰性ヒストグラムの谷

 このように、モード法は、対象とする図形と背景の濃度値の差が大きく、上の図のようにヒストグラムにはっきりと谷が出来るときに有効な方法です。

 4.3節 判別分析2値化法

 Pタイル法もモード法も結局のところは、人間の判断が必要です。では、コンピュータにすべてまかせて、自動的にしきい値を求めてくれる方法はないのでしょうか? それがこの判別分析2値化法なのです。

 ヒストグラムにおいて、しきい値 t で2つのクラスに分割し、2つのクラス間の分離が最も良くなるようにパラメータ t を決める方法です。もう少し具体的に言うならば、2値化した時、背景とパターン領域に関するクラス内分散とクラス間分散の分散比が最大になるように閾値を決定します。

 ここで、分散とは分布のばらつき具合をあらわすものです。クラス内分散は各クラスの分散の平均であり、クラス間分散は各クラスの平均の分散のことをいいます。少しややこしく、分かりにくいかもしれませんが、この方法は、ヒストグラムに山や谷が見られない場合でも閾値を決定することができます。

 以下に少し詳しく説明します。与えられた画像のとりうる濃度値の最大値を 255 、h (z )を濃度値z における度数とすると、全画素数 H は、H = h (1) + h (2) + … + h (255) となります。このとき、次のような正規されたヒストグラムを考えます。

  判別分析2値化法1   (1)

 ここで、p (1) + p (2) + … + p (255) = 1 , p (i ) ≧ 0 であり、式(1)は、濃度の確率分布とみなすことができます。これを用いて、画像の全平均レベルμT 、全分散σT 2 はそれぞれ次式で与えられます。

  判別分析2値化法2
 
  判別分析2値化法3  

 以上のことをふまえた上で、以下の式において σB 2 が最大になるような最適しきい値 k * を求めます。この k * が求める判別分析2値化法におけるしきい値となるのです。

判別分析2値化法2

判別分析2値化法3

 実際の計算では、w (k ) , μ(k ) について次式のような漸化式が作れるので、簡単に σB 2 を計算することができます。

w (k ) = w (k -1) + p (k ) , μ(k ) = μ(k -1) + k p (k ) , w (1) = μ(1) = p (1)

 このように、多少計算は難しいですが、この判別分析2値化法を使うことによって、どのような画像でも、自動的に比較的良好なしきい値を算出することが可能になります。

ページの上へ 前の章へ 上のページへ 次の章へ


企画・製作 村上研究室 HP製作委員会(2001)
ご意見・お問い合わせは、こちら までどうぞ。