JP2010244381A

JP2010244381A - ガボアフィルタ、画像認識装置および方法、プログラム、並びに記録媒体

Info

Publication number: JP2010244381A
Application number: JP2009093623A
Authority: JP
Inventors: Atsushi Okubo; 厚志大久保
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2009-04-08
Filing date: 2009-04-08
Publication date: 2010-10-28
Also published as: US20100260424A1; EP2239687A2; CN101859381A

Abstract

【課題】どのような画像のどのような特徴点においてもより少ない演算量でより正確な局所特徴量を算出することができるようにする。
【解決手段】ガボアフィルタの形状を決めるパラメータσの値を、周波数パラメータνの関数で表される可変値とする。図中下側の周波数の低いガボアフィルタにおいても、画素の色が白から黒に変化する波が、矩形の領域からはみ出していない。このように、本発明を適用したガボアフィルタは、DC-Free特性を満たすとともに、低い周波数でも積分区間を大きくとる必要がない。
【選択図】図９

Description

本発明は、ガボアフィルタ、画像認識装置および方法、プログラム、並びに記録媒体に関し、特に、どのような画像のどのような特徴点においてもより少ない演算量でより正確な局所特徴量を算出することができるようにするガボアフィルタ、画像認識装置および方法、プログラム、並びに記録媒体に関する。

２枚の顔画像が同一人物のものか否かを識別する際に、ガボアフィルタを用いて、顔の様々な特徴点の局所特徴ベクトル（Gabor Jet）を抽出し、ガボアフィルタの全ての次元の相関値のみから構成される相関ベクトルをSVM（support vector machine）を用いて学習し、識別器を生成して、これを用いて識別処理を実行する技術がある。

ガボアフィルタは顔認識に代表される様々な画像認識のための特徴量として広く利用されている。ガボアフィルタを利用した顔識別技術については、例えば、非特許文献１に開示されている。非特許文献１では、顔特徴点の局所特徴量を畳み込み積分による演算により求めている。

また、上述の演算式はDC-Free特性を満たしており、照明変化にロバストな特徴量を抽出することが可能である。DC-Free特性を満足するためには無限積分区間で積分する必要があるが、実際には画像を無限に積分することは不可能であるため、ガウスの窓関数の幅に対して積分範囲を十分に大きくするようになされている。

また、出願人は、Adaboostを利用した統計学習処理を実行し、認識モードにおける認識処理に用いる認識器を生成する画像処理装置を先に提案した（例えば、特許文献１参照）。特許文献１では、例えば、４０個のガボアフィルタにより得られた特徴量のうちの一部を、スケール、方向毎に並べた特徴次元から、任意の位置、大きさの矩形領域を選択することにより、何組かの局所特徴量の組み合わせを決められる。これにより、不要なパラメータによる影響を排除することができる。

特開２００８−１６５７３１号公報

「Face Recognition by Elastic Bunch Graph Matching，von der Malsburg」

非特許文献１においては、ガボアフィルタの形状を決めるパラメータσの値を様々な周波数、方向パラメータを持つガボアカーネルにおいて共通とし、σ=2πとしている。このため、ガウスの窓関数の幅はσ/kとなり、周波数kに半比例した大きさとなるため、低周波な特徴量を計算する際には大きな積分区間を取る必要がある。

しかしながら、一般的に物体の画像特徴量抽出処理において大きな積分区間を必要とする畳み込み演算を行う際には以下のような問題点がある。

第１に、積分区間に対応して十分大きな入力画像を用意する必要がある。

第２に、例えば、カーネルをあらかじめ計算してメモリに保存しておく場合、大きなメモリ領域を必要とする。

第３に、物体と背景の境界付近の特徴量抽出する際には、背景画像領域の特徴量が多く含まれてしまう。

第４に、計算量が積分面積に比例して増加する。

このような問題点があるため、実際に計算する際にはDC-Free特性が満たされないことを許容した上で、積分区間を制限して畳み込み演算をすることが多い。このような場合には照明変化に対するロバスト性が低下することになる。

本発明はこのような状況に鑑みてなされたものであり、どのような画像のどのような特徴点においてもより少ない演算量でより正確な局所特徴量を算出することができるようにするものである。

本発明の第１の側面は、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタである。

前記ガボアフィルタの演算における積分区間によって決まる定数ν0を設定し、前記パラメータσが、

により演算される可変値とされるようにすることができる。

入力画像の濃淡値をＩとし、前記方向を特定する方向パラメータをμとし、前記複数のガボアフィルタのｊ番目のガボアフィルタの結果Ｊjが、

ただし、

により演算されるようにすることができる。

本発明の第１の側面においては、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値が、前記周波数を特定する周波数パラメータνの関数で表される可変値とされる。

本発明の第２の側面は、入力された画像データの画像の特徴点を検出する特徴点検出手段と、前記特徴点の局所的な特徴量を、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出する特徴量検出手段と、前記検出された特徴量と、予め登録されている画像の特徴量との相関係数を演算する演算手段と、前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果を出力する出力手段とを備える画像認識装置である。

前記ガボアフィルタの演算における積分区間によって決まる定数ν0を設定し、前記パラメータσを、

により演算される可変値とするようにすることができる。

入力画像の濃淡値をＩとし、前記複数のガボアフィルタのｊ番目のガボアフィルタの結果Ｊjが、

ただし、

により演算されるようにすることができる。

本発明の第２の側面は、入力された画像データの画像の特徴点を検出し、前記特徴点の局所的な特徴量を、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出し、前記検出された特徴量と、予め登録されている画像の特徴量との相関係数を演算し、前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果を出力するステップを含む画像認識方法である。

本発明の第２の側面は、コンピュータを、入力された画像データの画像の特徴点を検出する特徴点検出手段と、前記特徴点の局所的な特徴量を、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出する特徴量検出手段と、前記検出された特徴量と、予め登録されている画像の特徴量との相関係数を演算する演算手段と、前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果を出力する出力手段とを備える画像認識装置として機能させるプログラムである。

本発明の第２の側面においては、入力された画像データの画像の特徴点が検出され、前記特徴点の局所的な特徴量が、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出され、前記検出された特徴量と、予め登録されている画像の特徴量との相関係数が演算され、前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果が出力される。

本発明によれば、どのような画像のどのような特徴点においてもより少ない演算量でより正確な局所特徴量を算出することができる。

本発明の一実施の形態に係る画像処理装置の構成例を示すブロック図である。４０個のガボアフィルタを、スケールおよび方向を基にして並べた場合の一例を示すものである。コサイン（またはサイン）成分からなるキャリアの例を示す図である。ガウス窓関数の例を示す図である。図３と図４に対応するガボアフィルタの特性の波形の例を示す図である。コサイン（またはサイン）成分からなるキャリアの別の例を示す図である。ガウス窓関数の別の例を示す図である。従来のガボアフィルタの例を示す図である。本発明を適用したガボアフィルタの例を示す図である。図１の画像処理装置による認識処理の例を説明するフローチャートである。ガボアフィルタの中から、任意の位置、大きさの矩形領域が選択されることを説明する図である。本発明の一実施の形態に係る画像処理装置の別の構成例を示すブロック図である。図１２の画像処理装置による学習処理の例を説明するフローチャートである。図１３の画像処理装置による認識処理の例を説明するフローチャートである。パーソナルコンピュータの構成例を示すブロック図である。

以下、図面を参照して、本発明の実施の形態について説明する。

図１は、本発明の一実施の形態に係る画像処理装置１１の構成例を示すブロック図である。

画像処理装置１１は、人物の撮像画像を用いて、画像認識処理を実行し、その人物が登録された人物か否かを判定する処理を実行することができる。

画像処理装置１１は、後述するガボアフィルタによる処理を施すことによって画像を認識し、認識対象の画像が、登録された人物の顔を含むものであるか否かを判定する処理を実行する。

画像処理装置１１は、画像取得部３１、顔検出部３２、顔画像変換部３３、顔認識処理部３４、顔登録データベース３５、および、認識結果出力部３６から構成されている。

なお、ここでは、画像処理装置１１に顔登録データベース３５が含まれるものとして説明するが、顔登録データベース３５は、例えば、図示せぬネットワークなどを介して、画像処理装置１１に接続されているような構成とすることも可能である。ネットワークなどを介して顔登録データベース３５が接続されることにより、複数の画像処理装置１１で１つの顔登録データベース３５を共有することが可能となる。

画像取得部３１は、例えば、カメラなどを含む構成とされ、人を撮像する機能を有するか、または、外部に備えられたカメラ、もしくは、他の装置から、撮像された人の画像を取得する。また、画像取得部３１は、認識対象となる人物の顔の部分を含む撮像画像を取得する。画像取得部３１により取得される画像は、人の顔の部分が少なくとも含まれる画像である。画像取得部３１に取得された画像は、顔検出部３２に供給される。

顔検出部３２は、画像取得部３１から供給された画像を解析することにより、人の顔の部分（顔の位置と大きさ）を抽出し、抽出された人の顔の部分の画像（以下、顔画像と称する）を検出する。画像取得部３１から供給される画像は、認識対象のユーザの顔を含む画像であるが、例えば、全身像が撮影されているような画像など、顔の画像だけでない場合もある。顔検出部３２は、そのような画像から、人の顔の領域を判断し、人の顔の部分に対応する画像を抽出する。検出された顔画像は、顔画像変換部３３の顔特徴点検出部５１および顔アライメント部５２に供給される。

顔画像変換部３３は、顔特徴点検出部５１、および、顔アライメント部５２から構成される。

顔特徴点検出部５１は、顔検出部３２から供給された顔画像とから、後述する顔アライメント部５２によるモーフィング処理に用いられるアライメント用特徴点を検出する。アライメント用特徴点は、例えば、目、鼻、口といった人の顔の中のでも特徴となる部分、すなわち、顔特徴部分であってもよいし、顔特徴部分のみならず、もっと詳細に部分分けして特徴点を検出するようにしても良い。

顔特徴点検出部５１は、例えば、ＡＡＭ(Active Appearance Models)と称される方法などを適用して、特徴位置を検出することが可能である。

顔アライメント部５２は、顔検出部３２から供給された顔画像、および、顔特徴点検出部５１により検出されたアライメント用特徴点を解析することにより、抽出された顔が、どの方向を向いているかを検出する。そして、顔アライメント部５２は、顔特徴位置が基準位置にくるように、アフィン変換などのモーフィング処理を行う。これにより、例えば正面からみた顔の画像である場合には、左右の目が水平な位置に所定の距離はなれて位置し、左右の目の中間の下方に鼻が位置し、その鼻よりさらに下方に口が位置するようにモーフィング処理が行われる。従って、顔検出部３２から供給された顔画像が正面を向いていないものであっても、正面を向いた場合の顔画像と略同様なものに変換されるのである。その結果、画像取得部３１により取得された顔画像が正面を向いていない場合であっても識別が可能になる。

顔認識処理部３４は、局所特徴計算部７１、および顔認識部７４を含んで構成される。

抽出された特徴点が基準位置に直された顔画像は、顔認識処理部３４の局所特徴計算部７１に供給される。局所特徴計算部７１は、供給された顔画像の複数の特徴点における局所的な特徴量を計算する。局所特徴量を求めるための特徴点は、顔特徴点検出部５１において検出されたアライメント用特徴点と同一であっても良いし、顔特徴点検出部５１において検出されたアライメント特徴点とは全く異なる複数の点であっても良い。局所特徴計算部７１は、ガボアフィルタ（Gabor Filter）で構成される。

ここで、ガボアフィルタの処理（ガボアフィルタリング）について説明する。最初に、従来のガボアフィルタの処理について説明する。

人間の視覚細胞には、ある特定の方位に対して選択性を持つ細胞が存在することが既に判っている。これは、垂直の線に対して反応する細胞と、水平の線に反応する細胞で構成される。ガボアフィルタリングは、これと同様に、方位選択性を持つ複数のフィルタで構成される空間フィルタである。

ガボアフィルタは、ガボア関数によって空間表現される。ガボア関数は、次の式（１）により表される。

・・・（１）

式（１）において、ベクトル記号が付されたｘは、入力画像の特徴点の座標位置を表す要素（x,y）からなる２次元のベクトルとされる。なお、特徴点の座標位置は、例えば、顔特徴点検出部５１において検出されたアライメント用特徴点の座標位置とされる。

また、式（１）においてσは、ガボア関数の形状、すなわちガボアフィルタの形状を決めるパラメータとされる。

さらに、式（１）におけるｋ_jは、周波数パラメータ、方向パラメータから定まる局所特徴量を表すものであって、実際には要素（ｋ_jx，ｋ_jy）を有する２次元ベクトルであり、式（２）により表される。

・・・（２）

従って、式（１）に示されるガボア関数は、コサイン（またはサイン）成分からなるキャリアに２次元ガウス分析状のエンベローブ（ガウス窓関数）が乗じられることで構成されるものである。

なお、ｋ_νは、ガボアフィルタの周波数に対応する値とされ、周波数パラメータνにより変化する。また、φ_μは、ガボアフィルタの方向に対応する値とされ、方向パラメータμにより変化する。

例えば、周波数パラメータνを５通り設定し、方向パラメータμを８通り設定することにより、４０（＝５×８）個のガボアフィルタが得られることになる。式（１）、式（２）におけるパラメータｊは、上述した４０個のガボアフィルタのいずれかを特定するものであり、式（３）により表される。

・・・（３）

ガボアフィルタの処理における特徴量の計算においては、それぞれ異なる方向および周波数の複数のガボアフィルタを用いて、それぞれの特徴量を計算する。ここでは、８種類の方向と５通りの周波数を採用して、合計４０個のガボアフィルタを用いて、それぞれの特徴点の特徴量を計算する処理を行うものとする。

なお、式（１）の演算結果は、後述する式（４）により特徴量ベクトル（Gabor Jet）を得るときに必要となるので、例えば、予め演算されてメモリなどに保存されるようにしてもよい。すなわち、１つの特徴点を中心とする所定の範囲内の画素のそれぞれについて、式（１）の演算結果をメモリなどに保存するようにしてもよい。

例えば、式（１）において、ベクトル記号が付されたｘを、（x-32,y-32）乃至（x+32,y+32）のそれぞれに置き換えて得られた演算結果のそれぞれを、予めメモリなどに保存しておくようにしてもよい。このようにすることで、後述する式（４）での積分の演算を高速に行うことができる。

図２は、４０個のガボアフィルタを、スケールおよび方向を基にして並べた場合の一例を示すものである。なお、このガボアフィルタは、従来のガボアフィルタであり、本発明のガボアフィルタについては、図９を参照して後述する。図２の中の４０個の個矩形のそれぞれが、ガボアフィルタを可視化したものとされる。ここでは、図中それぞれの矩形の面積に対応する画像の画素位置に乗じられるガボアフィルタのフィルタ係数を色分けすることでガボアフィルタを可視化している。図中白く見える部分は、フィルタ係数値が高い部分であり、図中黒く見える部分は、フィルタ係数値の低い部分である。

図２においては、図中、縦軸が周波数方向の変化量を示し、上部ほど周波数は大きく（高く）、下部ほど周波数は小さい（低い）。そして、図中、横軸がフィルタ方向（角度）の変化量を示し、一番左が０度に対応し、右に行くほど角度が増え、中央部分が９０度に対応し、一番右が最も１８０度に近い角度に対応する。すなわち、図２のフィルタの配列において、一番左の列のフィルタと一番右の列のフィルタとは、角度の変化として連続するフィルタである。

上述した周波数パラメータνにより図２の縦軸上の位置が特定され、方向パラメータμにより図２の横軸上の位置が特定されることになる。

例えば、人間の顔の中で、目の付近の特徴量を計算する処理には、周波数が大きく、角度が０度、１８０度付近となるフィルタが適している。また、例えば、人間の顔の中で、鼻の付近の特徴量を計算する処理には、周波数が小さく、角度が９０度付近となるフィルタが適している。

ガボアフィルタのレスポンスは、ｊ番目のガボアフィルタの結果（Gabor Feature）をＪjとし、入力画像の濃淡値をＩとすると、式（４）で表される。なお、式（４）においては、特徴点がベクトル記号の付されたｘ_iとして表され、例えばiは、１からＭまでの整数とされる。

・・・（４）

すなわち、式（４）では、特徴点の周辺の所定の範囲（例えば、特徴点の画素から垂直および水平方向に±３２画素の範囲）を積分区間とする畳み込み積分が行なわれるのである。１つの特徴点に対して、４０個のガボアフィルタを用いると、４０個の特徴量が得られる。換言すれば、１つの特徴点に対して、４０個のパラメータ（要素）を有する特徴量ベクトル（Gabor Jet）を得ることができる。

なお、上述したように、例えば、式（１）において、ベクトル記号が付されたｘを、（x-32,y-32）乃至（x+32,y+32）のそれぞれに置き換えて得られた演算結果のそれぞれを、予めメモリに保存しておけば、式（４）での積分の演算を高速に行うことができる。

ところで、式（１）を参照して上述したガボア関数は、DC-Free特性を満たすようになされている。DC-Free特性を持つ画像の特徴量とは、画像のDC成分に影響されない特徴量のことである。このような特徴量を用いると、例えば、同じ被写体をカメラのホワイトバランスや絞りなどを変えて撮像した画像Ａと画像Ｂがある場合、画像Ａと画像Ｂが同一の被写体の画像であることを認識できるようにする特性が向上する。すなわち、DC-Free特性を有するガボアフィルタは、画像の色味、撮像時の光量などに影響されにくい特徴を抽出することができるのである。

式（１）においては、「−exp(-σ²／２)」という項が含まれることにより、式（１）がDC-Free特性を満たすようになされている。上述したように、式（１）においてパラメータσは、ガボアフィルタの形状を決めるパラメータとされ、従来のガボアフィルタの処理では、Gabor Jetを計算する際、パラメータｊの値に係らず共通の値を用いていた。すなわち、上述した式（４）において、パラメータｊを変化させることにより４０個のガボアフィルタに対応する４０個の特徴量が演算されるが、それら４０の演算においてパラメータσの値は全て同じ値を用いていた。

例えば、文献「Face Recognition by Elastic Bunch Graph Matching，von der Malsburg」などに開示されている方式においては、パラメータσ=２πとされている。

また、上述したように、式（１）は、コサイン（またはサイン）成分からなるキャリアにガウス窓関数が乗じられることで構成されている。式（１）における「（ｋ_j ²／σ²）exp（−（ｋ_j ²x²/２σ²））」は、ガウス窓関数であり、このガウス窓関数の幅はσ／ｋとして求めることができる。すなわち、式（１）におけるガウス窓関数の幅はガボアフィルタの周波数に反比例する。

このガウス窓関数の幅が大きい場合、式（４）に示される特徴量ベクトルの演算において、大きな積分区間を取る必要がある。

例えば、図３に示されるようなコサイン（またはサイン）成分からなるキャリアに、図４に示されるようなガウス窓関数が乗じられる場合を考える。なお、図３と図４において、図中横軸が、例えば、画素位置に対応し、図中縦軸が、例えば、フィルタの係数値に対応する。

図３に示される波形の周波数は、上述したガボアフィルタの周波数に対応する。ガウス窓関数の幅は、図４にｗとして示されている。この場合、ガボアフィルタの特性は、図５に示される波形により表されることになる。図５においては、図中中央のガウス窓関数の値が高くなる部分において振幅が大きく、図中左右両端付近のガウス窓関数の値が低くなる部分において振幅が小さくなる波形が示されている。

図２に示されるガボアフィルタにおいては、４０個のフィルタの全てにおいて画素の色が白から黒に変化する４つの波（縞）を観察することができる。このように、ガボアフィルタは、ガウス窓関数の減衰に応じて振幅が変化する波形に対応する形状となるのである。

いま、図３より周波数の低い図６に示されるようなコサイン（またはサイン）成分からなるキャリアを考える。上述したように、式（１）におけるガウス窓関数の幅はガボアフィルタの周波数に反比例するから、図６のキャリアの周波数に対応するガウス窓関数は、図７に示されるように、幅ｗの大きいものとなる。従って、ガボアフィルタの周波数が低い場合、図中横軸を充分に大きくとらないと、ガウス窓関数の減衰に応じて振幅が変化する波形を観察することができない。つまり、周波数が低い場合、図７に示されるように、図中横軸（例えば、画素位置）を大きくとらないと、ガウス窓関数が充分に減衰しない。

従って、ガボアフィルタの周波数が低い場合、入力画像の面積も充分に大きいものとしなければ、適切に特徴量を得ることができないのである。

すなわち、従来のガボアフィルタでは、低周波な部分（例えば、人の顔の中の鼻の部分など）の特徴量を計算する際には、式（４）の演算において、特徴点の周辺の多数の画素を用いる必要がある。すなわち、式（４）の演算における積分区間を大きくする必要がある。

しかしながら、式（４）により特徴量ベクトルを演算するにあたり、上述のように大きな積分区間を必要とする畳み込み演算を行う際には以下のような問題点がある。

第１に、式（４）の積分区間に対応して十分大きな面積の入力画像を用意する必要がある。例えば、図２に示されるフィルタにおいて、真にDC-Free特性を満たすようにするためには、周波数の低い（小さい）図中下側のフィルタの面積をより大きいものとする必要がある。

第２に、例えば、式（１）をあらかじめ計算してメモリに保存しておく場合、大きなメモリ領域を必要とする。すなわち、真にDC-Free特性を満たすようにするためには、周波数の低いフィルタの面積をより大きいものとする必要があるので、当然に積分区間も大きくなる。その結果、例えば、式（４）において、添え字のｊが周波数の低いガボアフィルタを表すものである場合、より多数の演算結果をメモリに保存しておかなければ、式（４）での積分の演算を高速に行うことができない。

例えば、式（４）において、添え字のｊが周波数の高いガボアフィルタを表すものである場合、式（１）のベクトル記号が付されたｘを、例えば、（x-32,y-32）乃至（x+32,y+32）のそれぞれに置き換えて得られた演算結果のそれぞれを、予めメモリに保存しておけばよい。しかし、添え字のｊが周波数の低いガボアフィルタの場合、式（１）のベクトル記号が付されたｘを、例えば、（x-160,y-160）乃至（x+160,y+160）のそれぞれに置き換えて得られた演算結果のそれぞれを保存しておかなければ、式（４）での積分の演算を高速に行うことができない。

第３に、積分区間が大きいので、例えば、顔と背景の境界付近の特徴量抽出する際には、背景の領域の特徴量が多く含まれてしまう。

第４に、式（４）の演算の計算量が入力画像の面積に比例して増加する。すなわち、第２の問題点においても述べたように、積分区間が大きくなると、演算量も増加するのである。

このような問題点があるため、従来のガボアフィルタの処理において、実際に計算する際にはDC-Free特性が満たされないことを許容した上で、積分区間を制限して畳み込み演算をすることが多い。例えば、本来、低い周波数のガボアフィルタには、十分大きな面積の入力画像を用意する必要があるが、実際には、高い周波数のガボアフィルタの入力画像と面積が変わらない入力画像が用いられている。しかし、このような場合には照明変化に対するロバスト性が低下することになる。

そこで、本発明においては、積分区間を制限してもDC-Free特性を満たすことができるようにする。

上述したように従来のガボアフィルタの処理においては、式（１）においてパラメータσの値を一定（例えば、２π）としていたが、本発明においては、パラメータσの値を可変とする。本発明では、パラメータσの値を、周波数パラメータνの関数で表すものとし、式（５）により求めるものとする。

・・・（５）

式（５）において、ν0は、式（４）の演算における積分区間によって決まる定数とされる。

本発明のガボアフィルタの処理では、上述した式（１）に替えて、式（６）を採用する。なお、式（６）は、式（１）に、式（２）と式（５）を代入することにより得られるものである。

・・・（６）

なお、式（１）は、パラメータσの値によらずDC-Free特性を満たすため、式（６）もDC-free特性を満たすことになる。

式（６）においては、ガウス窓関数の幅が２の（-（ν-ν0）／２）乗となり、ガボアフィルタの周波数によらず、一定幅となる。従って、積分区間内でガウス窓関数を十分減衰させるようにν0を適切な値に設定すれば、任意の積分区間で周波数の大きさによらずDC-free特性を満たすガボアフィルタを構成することが可能となる。

本発明では、式（６）で示されるψ_j（x）を、式（４）の演算に用いることにする。そして、本発明を適用した画像処理装置１１の局所特徴計算部７１は、式（６）で示されるψ_j（x）を、式（４）の演算に用いて得られる特徴量を出力する。従って、例えば、式（４）での積分の演算を高速に行うようにするために、１つの特徴点を中心とし、積分区間に対応する所定の範囲内の画素のそれぞれについて、式（６）の演算結果をメモリなどに保存するようにしてもよい。積分区間は、例えば、画像処理装置１１のユーザが任意に設定することが可能であり、設定された積分区間に対応して、上述した式（５）、式（６）の定数ν0の値が決まることになる。

図８と図９は、従来のガボアフィルタと、本発明を適用したガボアフィルタとの違いを説明する図である。ここでは、８種類の方向と５通りの周波数のコサイン・サインのフィルタを採用して、合計８０個のガボアフィルタが用意されている場合を例として説明する。図８と図９においては、図中８０（＝８×１０）個の矩形のそれぞれが、ガボアフィルタを表している。

図８は、従来のガボアフィルタの例を示す図であり、図９は、本発明を適用したガボアフィルタの例を示す図である。ここでは、図中それぞれの矩形の面積に対応する画像の画素位置に乗じられるガボアフィルタのフィルタ係数を色分けすることでガボアフィルタを可視化している。図中白く見える部分は、フィルタ係数値が高い部分であり、図中黒く見える部分は、フィルタ係数値の低い部分である。

また、図８と図９においては、図中、縦軸が周波数方向の変化量を示し、上部ほど周波数は大きく、下部ほど周波数は小さい。そして、図中、横軸がフィルタ方向（角度）の変化量を示し、一番左が０度に対応し、右に行くほど角度が増え、中央部分が９０度に対応し、一番右が最も１８０度に近い角度に対応する。

図８の場合、図中下側の周波数の低いガボアフィルタにおいては、画素の色が白から黒に変化する波が、矩形の領域からはみ出している。一方、図９の場合、図中下側の周波数の低いガボアフィルタにおいても、画素の色が白から黒に変化する波が、矩形の領域からはみ出していない。このように、本発明を適用した図９のガボアフィルタは、DC-Free特性を満たすとともに、低い周波数でも積分区間を大きくとる必要がないのである。

図１に戻って、局所特徴計算部７１により算出された特徴量は、顔認識部７４に供給される。

顔認識部７４は、局所特徴計算部７１により算出された特徴量ベクトルと、顔登録データベース３５に登録されている登録顔画像データを比較、すなわち、相関係数を計算し、登録されている人物と一致するか否かを判断し、判断結果を認識結果出力部３６に供給する。

顔登録データベース３５は、登録されている人物の認識に必要な特徴量の情報が登録されている。すなわち、顔登録データベース３５には、登録されている人物の顔画像の特徴点における全てのGabor Jetが登録される。

顔登録データベース３５に登録されている特徴量のデータ（登録顔画像データ）は、図１の画像取得部３１乃至局所特徴計算部７１の処理が施されることにより、取得され、登録されるデータとされる。あるいはまた、画像取得部３１乃至局所特徴計算部７１の処理が施されて得られるデータと同様のデータであれば、外部から取得されて登録されるデータであってもよい。

認識結果出力部３６は、顔認識部７４から供給された判断結果を、例えば、ブザー音、テキスト表示、LED点灯などによって外部に通知したり、判断結果を外部の装置に出力する。具体的には、例えば、認識結果出力部３６は、例えば、ディスプレイなどを含んで構成されるものとしても良く、判定結果を、メッセージなどの形式で表示するものとしてもよい。

例えば、入力された画像に含まれる顔画像と一致する登録顔画像が、顔登録データベース３５に登録されていた場合、その顔画像の人物の名前などの情報が出力されるようにすることができる。例えば、一致していると判定された登録顔画像に関連付けられている人の名前などの情報が顔登録データベース３５から読み出され、その名前などの情報が、認識結果出力部３６に、判定結果として出力される。

また、入力された画像に含まれる顔画像と一致する登録顔画像が顔登録データベース３５に登録されていなかった場合、認識結果出力部３６に、登録されていないかったことを示す情報が出力されるようにすることができる。例えば、「未登録の人物です」といったメッセージが、判定結果として出力される。

このようにして、画像処理装置１１は、特徴量を比較することにより、得られた人の顔画像が登録されている人の顔画像と一致するか否かの識別を行う。

次に、図１０のフローチャートを参照して、本発明の画像処理装置１１による認識処理の例について説明する。

ステップＳ１０１において、顔検出部３２は、画像取得部３１により取得された顔画像を含む画像から顔に対応する部分を検出し、検出された顔画像を、顔特徴点検出部５１および顔アライメント部５２に供給する。

ステップＳ１０２において、顔特徴点検出部５１は、顔の特徴的な部分（顔特徴位置）、例えば、目、鼻、口といった特徴的な部分を検出する。

ステップＳ１０３において、顔アライメント部５２は、顔検出部３２から供給された顔画像に対して、顔特徴点検出部５１により検出された顔特徴点に基づいて、例えば、アフィン変換などによりモーフィング処理を行い、正面から撮像された場合の顔画像に対応するように変換する。変換された顔画像は、局所特徴計算部７１に供給される。

ステップＳ１０４において、局所特徴計算部７１は、例えば、図９を参照して上述したような、ガボアフィルタ（Gabor Filter）を用いて、局所特徴量を算出する。このとき、上述したように、本発明では、式（６）で示されるガボアカーネルを、式（４）の演算に用いて特徴量ベクトルが演算される。

ステップＳ１０５において、顔認識部７４は、顔登録データベース３５から、登録顔の特徴量を読み出す。

ステップＳ１０６において、顔認識部７４は、相関係数を計算する。このとき、顔認識部７４は、局所特徴計算部７１から供給された特徴量ベクトルと、顔登録データベース３５から読み出された登録顔の特徴量ベクトルとの相関係数を計算する。

ステップＳ１０７において、認識結果出力部３６は、顔認識部７４から供給された計算結果に基づいて、対象物体の有無の認識結果を出力する。例えば、認識しようとする対象物体（例えば、顔登録データベース３５から読み出された登録顔）が入力画像に含まれているか否かを表す認識結果が出力される。

ところで、特徴量ベクトルを構成するGabor Jetは、様々な周波数及び方向パラメータを持つものが用意されている。しかし、特に顔画像の特徴を求める場合には、特徴点の位置によって特徴を記述するのに必要な周波数及び方向パラメータは異なるため、それぞれの特徴点では不要なパラメータが存在する可能性がある。

そして、このような不要なパラメータから求められたGabor Featureは、一般的にその特徴点の局所特徴と無相関な値を取る可能性が高いため、それらを含む特徴量ベクトル間で相関係数を求める場合に、得られる結果に悪影響を及ぼす可能性がある。

また、ある特徴点の局所特徴が複数の独立した要因（例えば、表情、個人性、めがね等）で表現されている場合、Gabor Jetの全てから構成される特徴量ベクトル間の相関値では、それらの要因の独立な相関を評価することが不可能である。

不要なパラメータではないもの、すなわち、特徴点により必要な周波数帯域および方向は、連続した範囲内にあると仮定することができる。そこで、全ガボアフィルタをスケール、方向毎に並べた図２のような特徴次元から、例えば、図１１に示される矩形１３１、矩形１３２、矩形１３３などように、任意の位置、大きさの矩形領域が選択されるようにしてもよい。このように、例えば、特徴点に応じて特徴量ベクトルの要素（以下、適宜局所特徴量という）の組み合わせが決められるようにすると、顔画像の特徴を求めるにあたって好適である。

このようにして、ガボアフィルタを、スケール、方向毎に並べた特徴次元から任意の位置、大きさの矩形領域を選択するものとすると、その組み合わせは、最高でも、₅C₂×₈P₂＝５６０通りとなり、合理的な数での特徴次元選択が可能になる。また、特徴点により必要な周波数帯域および方向が、組み合わせとして選択された矩形領域内にある場合、換言すれば、局所特徴とは無相関なGabor Featureの矩形領域内に含まれない場合には、無相関な特徴量が悪影響を及ぼすことを防ぐことができる。

従って、実際の顔画像の認識処理においては、個々の特徴点について、例えば、40個のガボアフィルタを用いて算出された全ての局所特徴量について相関係数を計算するのではなく、特徴点に応じて局所特徴量の組み合わせが決められるようにすることが好ましい。

このように、特徴点に応じて局所特徴量の組み合わせが決められるようにする場合、画像処理装置１１を、例えば、図１２に示されるように構成すればよい。図１２は、本発明の画像処理装置１１の別の構成例を示すブロック図である。図１２は、例えば、図９を参照して上述したガボアフィルタを用いて特徴量ベクトルを算出し、かつ特徴点に応じて局所特徴量の組み合わせが決められるようにする画像処理装置の一例を示すものである。同図において、図１に対応する部分には、それぞれ同一の符号が付されている。

図１２における画像取得部３１乃至顔画像変換部３３は、それぞれ図１を参照して上述したものと同様なので、詳細な説明は省略する。

図１２の構成において、画像処理装置１１は、学習モードと認識モードの２つの動作モードで動作する。学習モードとは、学習用の画像を用いて、認識処理を学習し、認識モードにおける認識処理に用いる認識器を生成する処理を実行する。認識モードとは、学習モードによって生成された認識器を用いて画像を認識し、認識対象の画像が、登録された人物の顔を含むものであるか否かを判定する処理を実行する。

また、図１２の場合、顔認識処理部３４は、局所特徴計算部７１、認識器生成部７２、学習データ格納部７３、および、顔認識部７４を含んで構成されている。

図１２の場合、局所特徴計算部７１により計算された特徴量ベクトルは、学習モードにおいては、認識器生成部７２に供給され、認識モードにおいては、顔認識部７４に供給されるようになされている。

図１２の場合、局所特徴計算部７１は、学習モードにおいて、４０個のガボアフィルタにより得られる特徴量のうちの少なくとも一部を含む複数次元の特徴ベクトルの組を局所特徴量として、それぞれの特徴点において、複数種類の組み合わせを生成する。

この組み合わせの中に、４０個のガボアフィルタにより得られた特徴量を全て含む組み合わせ、すなわち、４０次元の特徴ベクトルが含まれていても良いし、含まれていなくても良いことは、言うまでもない。

換言すれば、局所特徴計算部７１は、１つの特徴点に対して、４０以下のパラメータを有する複数の特徴量ベクトルを得ることができる。例えば、１つの顔画像に対して、N個の特徴点における局所特徴量が計算されるようになされているものとする。また、ガボアフィルタの組み合わせがP種類用意されているものとする。この場合、１つの特徴点に対して、P種類の特徴量ベクトルを得ることができ、１つの顔画像に対して、N×Pの特徴量ベクトルを得ることができる。

このように、局所特徴計算部７１は、４０個のガボアフィルタにより得られた特徴量のうちの一部を、何組か、局所特徴量として組み合わせる。しかし、その組み合わせから、局所特徴量として用いる組み合わせを選択するのは、ランダムな組み合わせであっても良いが、組み合わせの総数は、非常に大きな値である

そこで、局所特徴計算部７１は、図２のようなガボアフィルタから、例えば、図１１に示される矩形１３１、矩形１３２、矩形１３３などように、任意の位置、大きさの矩形領域を選択することにより、局所特徴量の組み合わせを決めるものとする。なお、ここでは、説明を簡単にするために、図２のガボアフィルタから図１１に示される矩形領域が選択されると説明したが、実際には、図９を参照して上述したガボアフィルタから、任意の位置、大きさの矩形領域が選択されることになる。

局所特徴計算部７１は、学習モードにおいて、それぞれの特徴点において、４０以下のパラメータを有する複数の特徴量ベクトルを、認識器生成部７２に供給する。また、局所特徴計算部７１は、認識モードにおいては、学習データ格納部７３に格納されている認識用特徴量に基づいて、対応する特徴点の対応する局所特徴量を計算し、顔認識部７４に供給する。認識用特徴量とは、認識器生成部７２において学習により生成された認識器において用いられているのが、いずれの特徴点のどの局所特徴量（ガボアフィルタのどの部分）であるかを示す情報である。

これにより、認識器の生成、および、顔認識時に実行される相関係数の算出を、それぞれの特徴点において、全ての次元を用いた特徴量ベクトルによる１種類の相関係数だけはなく、一部の次元を用いた特徴量ベクトルを含む複数の相関係数について行うことが可能となる。換言すれば、それぞれ異なる次元の複数の特徴量を学習および認識に用いることが可能となる。

認識器生成部７２は、学習モードにおいて、局所特徴計算部７１により算出された学習用画像の特徴量と、予め保持している学習用モデルの特徴量とを用いて、Adaboostを利用した統計学習処理を実行し、認識モードにおける認識処理に用いる認識器を生成する。そして、認識器生成部７２は、生成された認識器と、その認識器に関する情報（相関値と、その認識器の確からしさを示す情報）とを学習データ格納部７３に記憶させる。また、認識器生成部７２は、認識器の学習の過程で、対象となる顔画像を認識するのに大きく影響するモデル特徴量のみを抽出する。そして、認識器生成部７２は、認識器において用いられているのが、いずれの特徴点のどの局所特徴量（ガボアフィルタのどの矩形領域部分）であるかを示す情報である認識用特徴量として、学習データ格納部７３に供給して記憶させる。

Adaboostとは、“ランダムよりも少し良い弱い識別器”（WeakLearnerとも称する）を多数組み合わせることで、“強い識別器”を構築できるとする理論であり、1996年に、Freundらによって提案されているものである。認識器生成部７２により生成される認識器は、この“ランダムよりも少し良い弱い識別器”であり、それぞれの認識機は、自分の前に生成された認識機が不得意とする認識に重みを置くようにして生成される。

そして、認識処理においては、それぞれの弱認識器がどのくらい信頼をおけるかにより、信頼度を求め、それに基づき多数決を行うようになされる。

学習データ格納部７３には、認識器生成部７２により生成された認識器とその認識器に関する情報、および、認識用特徴量が格納される。

図１２の場合、顔認識部７４は、認識モードにおいて、学習データ格納部７３に格納されている認識器を用いて、局所特徴計算部７１により算出された特徴量と、顔登録データベース３５に登録されている登録顔画像データを比較する。例えば、特徴量と登録顔画像データとの相関係数を計算し、登録されている人物と一致するか否かを判断し、判断結果を認識結果出力部３６に供給する。すなわち、顔認識部７４は、学習データ格納部７３に格納されている認識器の信頼度に基づいて、認識器の判定結果の多数決を行い、登録されている人物と一致するか否かの判断を実行する。

図１２の場合、顔登録データベース３５は、登録されている人物の認識に必要な特徴量の情報が登録されている。すなわち、顔登録データベース３５には、登録されている人物の顔画像の全ての特徴点における全てのGabor Jetが登録されていても良いが、少なくとも、認識用特徴量に対応する特徴量の情報が登録されていればよい。

画像処理装置１１は、このように構成されるようにしてもよい。

なお、Adaboostを利用した統計学習処理を実行し、認識モードにおける認識処理に用いる認識器を生成する画像処理装置については、例えば、特開2008-165731に詳細に開示されている。

次に、図１３のフローチャートを参照して、画像処理装置１１を図１２のように構成した場合、画像処理装置１１で学習モードにおいて実行される学習処理について説明する。

ステップＳ１３１において、顔検出部３２は、画像取得部３１により取得された顔画像を含む画像から顔に対応する部分を検出し、検出された顔画像を、顔特徴点検出部５１および顔アライメント部５２に供給する。

ステップＳ１３２において、顔特徴点検出部５１は、顔の特徴的な部分（顔特徴位置）、例えば、目、鼻、口といった特徴的な部分を検出する。

ステップＳ１３３において、顔アライメント部５２は、顔検出部３２から供給された顔画像に対して、顔特徴点検出部５１により検出された顔特徴点に基づいて、例えば、アフィン変換などによりモーフィング処理を行う。これにより、正面から撮像された場合の顔画像に対応するように変換される。変換された顔画像は、局所特徴計算部７１に供給される。

ステップＳ１３４において、局所特徴計算部７１は、例えば、図９を参照して上述したような、ガボアフィルタ（Gabor Filter）を用いて、局所特徴量を算出する。

ステップＳ１３５において、局所特徴計算部７１は、ガボアフィルタにより得られた局所特徴量のうちの少なくとも一部を、例えば、図１１を用いて説明したように、何組か組み合わせ、認識器生成部７２に供給する。組み合わせの方法と生成される組み合わせの数は、実験的または経験的に、予め決められるものであっても良いが、例えば、図１１を用いて説明したようにして、周波数帯域および方向が連続するようにして選択するものとすると好適である。

ステップＳ１３６において、認識器生成部７２の相関係数算出部１０１は、学習用モデル特徴量記憶部１０２から、学習モデルの特徴量を読み出し、局所特徴計算部７１から供給された局所特徴量と同一の組み合わせの学習モデルの組み合わせとの相関係数を算出する。

ステップＳ１３７において、認識器生成部７２は、認識器を生成する。

ステップＳ１３８において、認識器生成部７２は、ステップＳ１３７の処理により生成された認識器を登録する。このとき、例えば、生成された認識器と、その認識器に関する情報（相関値と、その認識器の確からしさを示す情報）とが学習データ格納部７３に記憶される。

このような処理により、学習モードにおいて、認識器が生成されて学習データ格納部７３に格納されるとともに、認識器に対応するモデル特徴量とその認識器の信頼度が、学習データ格納部７３に格納される。すなわち、認識器生成に用いられたGabor Featureは、どの特徴点に対するどの組み合わせであるか（例えば、全部で４０個ガボアフィルタが用意されていたら、そのうちのいずれのフィルタの組み合わせであるか）を示す認識用特徴量、また、その認識器の確からしさを示す情報が、学習データ格納部７３に格納される。

次に、図１４のフローチャートを参照して、画像処理装置１１を図１２のように構成した場合、認識モードにおいて画像処理装置１１が実行する認識処理について説明する。

ステップＳ１７１において、顔検出部３２は、画像取得部３１により取得された顔画像を含む画像から顔に対応する部分を検出し、検出された顔画像を、顔特徴点検出部５１および顔アライメント部５２に供給する。

ステップＳ１７２において、顔特徴点検出部５１は、顔の特徴的な部分（顔特徴位置）、例えば、目、鼻、口といった特徴的な部分を検出する。

ステップＳ１７３において、顔アライメント部５２は、顔検出部３２から供給された顔画像に対して、顔特徴点検出部５１により検出された顔特徴点に基づいて、例えば、アフィン変換などによりモーフィング処理を行う。

ステップＳ１７４において、局所特徴計算部７１は、例えば、図９を用いて説明したような、ガボアフィルタ（Gabor Filter）を用いて、局所特徴量を算出する。

ステップＳ１７５において、局所特徴計算部７１は、学習データ格納部７３から、認識用特徴量の情報を取得する。

ここで、認識用特徴量の情報は、認識器生成に用いられたGabor Featureは、どの特徴点に対するどの組み合わせであるか（例えば、全部で４０個ガボアフィルタが用意されていたら、そのうちのいずれのフィルタの組み合わせのものが、どの特徴点において用いられて認識器に用いられたのであるか）を示す情報である。

ステップＳ１７６において、局所特徴計算部７１は、ガボアフィルタにより得られた局所特徴量と、取得された認識用特徴量の情報に基づいて、認識用特徴量に示された特徴点の局所特徴量の組み合わせを生成し、相関係数算出用情報として、顔認識部７４に供給する。

ステップＳ１７７において、顔認識部７４は、顔登録データベース３５から、登録顔の特徴量を読み出す。

ステップＳ１７８において、顔認識部７４は、学習データ格納部７３から認識器を読み出し、特徴量を代入して、計算する。顔認識部７４は、相関係数算出用情報として局所特徴計算部７１から供給された認識用特徴量に示された特徴点の局所特徴量の組み合わせと、顔登録データベース３５から読み出された登録顔の特徴量のうちの認識用特徴量に示された特徴点の局所特徴量の組み合わせに対応するものとの相関係数を演算する。そして、顔認識部７４は、得られた相関係数を特徴量として、学習データ格納部７３から読み出された認識器に代入して計算する。

ステップＳ１７９において、認識結果出力部３６は、顔認識部７４から供給された計算結果に基づいて、対象物体の有無の認識結果を出力する。

このようにすることで、特徴点に応じて局所特徴量の組み合わせが決められるようにすることができ、それぞれ異なる次元の複数の特徴量を学習および認識に用いることが可能となる。

なお、特徴点に応じて局所特徴量の組み合わせが決められるようにすることができるようにする画像処理装置１１の構成は、図１２に示したものに限られるものではなく、他の構成が適用されるようにしてもよい。

なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図１５に示されるような汎用のパーソナルコンピュータ７００などに、ネットワークや記録媒体からインストールされる。

図１５において、CPU（Central Processing Unit）７０１は、ROM（Read Only Memory）７０２に記憶されているプログラム、または記憶部７０８からRAM（Random Access Memory）７０３にロードされたプログラムに従って各種の処理を実行する。RAM７０３にはまた、CPU７０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU７０１、ROM７０２、およびRAM７０３は、バス７０４を介して相互に接続されている。このバス７０４にはまた、入出力インタフェース７０５も接続されている。

入出力インタフェース７０５には、キーボード、マウスなどよりなる入力部７０６、ＬＣＤ(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部７０７、ハードディスクなどより構成される記憶部７０８、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部７０９が接続されている。通信部７０９は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース７０５にはまた、必要に応じてドライブ７１０が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア７１１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部７０８にインストールされる。

上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア７１１などからなる記録媒体からインストールされる。

なお、この記録媒体は、図１５に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フロッピディスク（登録商標）を含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（MD（Mini-Disk）（登録商標）を含む）、もしくは半導体メモリなどよりなるリムーバブルメディア７１１により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM７０２や、記憶部７０８に含まれるハードディスクなどで構成されるものも含む。

なお、本明細書において上述した一連の処理は、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

１１画像処理装置，３１画像取得部，３２顔検出部，３３顔画像変換部，３４顔認識処理部，３５顔登録データベース，３６認識結果出力部，５１顔特徴点検出部，５２顔アライメント部，７１局所特徴計算部，７２認識器生成部，７３学習データ格納部，７４顔認識部

Claims

それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とする
ガボアフィルタ。
前記ガボアフィルタの演算における積分区間によって決まる定数ν0を設定し、
前記パラメータσが、

により演算される可変値とされる
請求項１に記載のガボアフィルタ。
入力画像の濃淡値をＩとし、前記方向を特定する方向パラメータをμとし、前記複数のガボアフィルタのｊ番目のガボアフィルタの結果Ｊjが、

ただし、

により演算される
請求項２に記載のガボアフィルタ。
入力された画像データの画像の特徴点を検出する特徴点検出手段と、
前記特徴点の局所的な特徴量を、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出する特徴量検出手段と、
前記検出された特徴量と、予め登録されている画像の特徴量との相関係数を演算する演算手段と、
前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果を出力する出力手段と
を備える画像認識装置。
前記ガボアフィルタの演算における積分区間によって決まる定数ν0を設定し、
前記パラメータσを、

により演算される可変値とする
請求項４に記載の画像認識装置。
入力画像の濃淡値をＩとし、前記複数のガボアフィルタのｊ番目のガボアフィルタの結果Ｊjが、

ただし、

により演算される
請求項５に記載の画像認識装置。
入力された画像データの画像の特徴点を検出し、
前記特徴点の局所的な特徴量を、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出し、
前記検出された特徴量と、予め登録されている画像の特徴量との相関係数を演算し、
前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果を出力する
ステップを含む画像認識方法。
コンピュータを、
入力された画像データの画像の特徴点を検出する特徴点検出手段と、
前記特徴点の局所的な特徴量を、それぞれ異なる方向および周波数の複数のガボア関数のそれぞれの形状を決めるパラメータσの値を、前記周波数を特定する周波数パラメータνの関数で表される可変値とするガボアフィルタにより検出する特徴量検出手段と、
前記検出された特徴量と、予め登録されている画像の特徴量との相関係数を演算する演算手段と、
前記相関係数に基づいて、入力された画像データの画像に予め登録されている画像が含まれているか否かの認識結果を出力する出力手段とを備える画像認識装置として機能させる
プログラム。
請求項８に記載のプログラムが記録されている記録媒体。