• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:画像のHessian行列の固有値の意味について)

画像のHessian行列の固有値の意味について

このQ&Aのポイント
  • 画像の中からコーナーを探すために使用される輝度値のHessian行列についての疑問です。
  • Hessian行列の固有値が大きい場合、その点はコーナーであるとされていますが、その理由が分かりません。
  • 固有値の本質を理解しておらず、解説が見つからないため、理解したいと考えています。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

ANo.1のコメントについてです。 > この方法についても、同じような理解でよいのでしょうか? (1) 画像に対してある旨い回転をしたとき、検出したいパターンが「特徴量の行列の非対角要素が0で対角要素が大きい」という状態と対応するような、特徴量の行列の作り方をしている。しかも、 (2) 画像の回転が、特徴量の行列を回転することと対応している(つまり、画像を回転してから特徴量の行列を計算するのと、特徴量の行列を計算してからそれを回転するのとが(ほぼ)等価である)、 ならば、どんな特徴量であろうとも、固有値の計算を利用して「画像が最もパターンに近くなるという意味で(ほぼ)最適な回転をしたときの、対角要素」が計算できることは自明かと思います。  きちんと証明することも難しくはないと思いますが(ただし、四角いピクセルでできた離散画像だと思うと大変そう)、ま、パターン認識の話でそこまでやらねばならんということもないでしょう。むしろ、直感的イメージを掴む方が大事だろうな。

xyz21takku
質問者

お礼

ありがとうございます。 非対角要素が0になるようにし、 固有値で比較するということは 画像(座標系)を回転させることで 評価する尺度をどの方向を向いたコーナーにおいても、統一させていることになり、その上で曲率を評価している という理解ができました! 固有値が求まるということは、固有ベクトルが2つ求まるということなので、実際にどんな角度(をもった座標系)からコーナーを見たときに、非対角要素が0になるのか、わかるんじゃないかな~と思ったのですが・・・ 画像上でその方向を考えようと思うと、 なかなか難しいですね><

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (3)

noname#221368
noname#221368
回答No.4

 #3です。すいません。間違えました。  ついこの間まで、f:R^2→R^2の平均曲率(の絶対値)の最小化を考えていたので、そっちとかぶってしまいました。輝度は、I:R^2→Rなので、ヤコビ行列は、^Tを転置記号として、   dI=|Ix,Iy||dx,dy|^T であり、勾配の二乗は、   dI^2=|dx,dy||Ix,Iy|^T|Ix,Iy||dx,dy|^T で、   |Ix,Iy|^T|Ix,Iy|  =|(Ix)^2 (IxIy) |   |(IyIx) (Iy)^2 | ですよね。混乱を招く事を言い、申し訳ありません。

全文を見る
すると、全ての回答が全文表示されます。
noname#221368
noname#221368
回答No.3

>なるほど旨いやり方だなあ。(#1さんより)  同感です。  私は現在プログラマーで、画像をピクセル単位で扱う事が、ときどきあります。また過去、構造関係の解析技術者をやっていた時期もあり、FEMやBEMをカスタマイズする時に、構造物の輪郭線の角を自動で判定させる方法はないものかと、考えた事があります(やりっぱなしで終わりましたが)。その経験から、もうちょっと説明したくなりました(← 大きなお世話)。  一般に二次微分は、外形の曲率にほぼ比例します。角で曲率は無限大です。従って#1さんの仰るように、「最もコーナーっぽく見えるように座標を回転させて」みた時に、固有値が無限大であれば、それは厳密にコーナーです。しかし画像はピクセル単位の離散データであるため、二次微分は差分で行うはずです。よって、差分データに基づけば、「固有値が飛び抜けて大きくなる差分中心点」は、コーナーの可能性大、となります。 >Tomasiさんの論文  基本発想は同じ、というイメージが沸きました。先の二次微分を差分に代行させる場合、最低3点必要です。これが「3×3程度のピクセルウィンドウ」の意味と思われます。そして、ヤコビ行列、 | I1x I2x | | I1y I2y | は各点での勾配を表し、勾配の絶対値の二乗は、 | (Ix)^2 (IxIy) | | (IyIx) (Iy)^2 | で表せます。二次微分を差分で代行させる場合、この絶対値二乗の値が大きければ、傾向として二次微分も大きくなるので、「3×3程度のピクセルウィンドウ」の平均評価として、 | Σ(Ix)^2 Σ(IxIy) | | Σ(IyIx) Σ(Iy)^2 | を用いる、という事だと思いました。Σは、ウィンドウ内での総和です。これも「旨いやり方だなあ」と思いました。

xyz21takku
質問者

補足

ありがとうございます。 自分の勉強不足のため、わからないことがあるのですが、 | I1x I2x | | I1y I2y | がヤコビ行列というのはわかります。 その絶対値の2乗を | (Ix)^2 (IxIy) | | (IyIx) (Iy)^2 | と書かれておられますが、その意味がいまいちわかりません。 I1とI2は違う変数での微分値ですよね?ということは、 | (I1x)^2 (I2xI1y) | | (I1yI2x) (I2y)^2 | となりそうなのですが、実際には確かに | Σ(Ix)^2 Σ(IxIy) | | Σ(IyIx) Σ(Iy)^2 | の形で使われています。 この間の関係がよくわからないので、よろしければ教えていただけないでしょうか?

全文を見る
すると、全ての回答が全文表示されます。
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 「コーナー」が直角に近いコーナーであって、しかもある特定の方向を向いている場合、その頂点においてHessian(要するに2階微分)が特徴的なパターン(すなわち、対角要素が大きく、非対角要素がほぼ0)を示す。このことから、その点がコーナーの頂点であるかどうかが判定できる、としましょう。  さて、固有値ってのは、簡単に言えば「ある行列Aが与えられた時、座標系をうまく回転して行列の非対角要素を0にする」という操作をしたときに得られる対角行列Bの、対角要素のことです。  なので、Hessianの固有値を計算することは、「Hessian Hを回転して得られる行列Gであって、旨い回転によってGの非対角要素が0になるようにした時の行列Gについて、その対角要素」を計算したことになる。ところで、その同じ回転を画像に適用した場合、回転した画像のHessianはGになる。  つまり、「コーナーがどっちを向いていても、上記の判定法にとって一番コーナーらしく見えるように図形を回転して眺めたときに、上記の判定法でコーナーだと判定されるかどうか」という判定をしていることと等価になるわけです。  そして、画像を回転するのは大変手間が掛かるけれど、Hessian行列Hを回転したものGを計算するなら簡単です。  なるほど旨いやり方だなあ。

xyz21takku
質問者

補足

どうもありがとうございます。 「画像を回転するかわりに、行列を座標変換している」 というのは、なるほど!と思いました。 昨日自分で調べたところによりますと、現在は、1次微分を用いて判別する方法が主流のようです。 Tomasiさんの論文では、Hessianの代わりに 勾配共分散行列とよばれる M= | Σ(Ix)^2 Σ(IxIy) | | Σ(IyIx) Σ(Iy)^2 | と呼ばれるものを、コーナーかどうか判別したいピクセルを中心とした3×3程度のピクセルウィンドウごとに計算し Mの固有値をとり、同様に2つの固有値が大きいとき、 その点はコーナーであるとされていました。 この方法についても、同じような理解でよいのでしょうか?

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 画像処理における行列演算の意味

    たとえば100×100画素の画像があるとします。その輝度値情報は100×100の行列になります。 その行列について共分散行列を出して、そこから導かれる固有値、固有ベクトルは物理的、数学的にどういった意味を持っているのでしょうか? よくわかりません。どうぞよろしくお願いいたします。

  • 微分方程式を行列形式で行列を求める+固有値を求める

    ①x1=y x2=(dy)/(dt)として、添付した微分方程式を行列形式で(dx→)/(dt)=Ax→で表したときの行列Aを求めよ ②行列Aの固有値λ1とλ2を求めよ と言う二つの問題が分かりません。どちらか片方でもいいので途中式や解説などを含めてご回答お願いします。

  • 行列の直行、固有値、基底ベクトルなど行列演算に関するイメージ

    行列の直行、固有値、基底ベクトルなど行列演算に関するイメージ 画像処理の勉強をしており、行列演算の理解が必要となってきているのですが、いまいちイメージがつかめません。 導き方などは昔習ったので分かるのですが、その意味やどういった風に活用するのかが分からないといった常態です。 行列の直行、固有値,固有ベクトル、基底ベクトルなど、行列の基本的な計算に関して、その意味について分かりやすく説明してくれているサイトってありませんか? ベクトルで例え、図入りで説明していてくれるとすごく助かります。

  • 固有値分解について

    画像の行列Aを固有値分解するとき、疑問に思うことがあったので質問します。 (1) 授業では、最初は(1)のように分解していましたが なぜか違うところでは(2)のように分解していました。 固有ベクトルを求める際、ベクトルをノルムで割るかどうかの 違いのようですが、これは行う必要があるのでしょうか? 計算すると、(1)、(2)共に行列Aとなるので正しいことは分かりますが わざわざ計算を面倒にする理由が分かりません。 (特異値分解と並べて板書してあったので、もしかしたら比較のためかも知れません) (2) テストでは、これに続いてスペクトル分解せよ、と出てきそうなのですが この場合、両者のどちらを元にスペクトル分解すればいいのでしょうか? (どちらでも正解かもしれませんが) よろしくお願いします。

  • 臨界点でHessianが0の時の極値の判定

    微分可能な実多変数関数の臨界点(全ての1回導関数が0になる点)でHessianが0でないときはHesse行列の固有値によってこの点が極値かどうかの判定ができることはよく知られていますが、Hessianが0になるときの判定法を書いてある本は少ないようです。私が考えた結果、次の結論に至りました。 (1)Hesse行列の0以外の固有値に符号が異なるものがあるときはこの点は極値ではない。なぜならば固有値が正の固有ベクトルの方向に関しては極小点となっており、固有値が負の固有ベクトルの方向に関しては極大点となっているから。 (2)Hesse行列の0以外の固有値がすべて同符号で固有値0の空間が1次元であるときは、固有値0の固有ベクトルの方向に関して極値になっているかを調べれば良い。これは1変数関数の極値の判定に帰着するので容易。 (3)Hesse行列の固有値0の独立な固有ベクトルが2個以上のときは、各固有ベクトルの方向に関して調べてもこの点が極値であるかどうかの判定はできない。 そこで、やっと質問ですが、(3)の場合は極値の判定はどの様にしたら良いのでしょうか。

  • 線形代数(行列)の応用、および世界観について

    大学1年生、数学専攻です。 最近、線形代数について学習をはじめたのですが、 どうも小さい部分からやっているせいか、全体像がつかめません。 そこで教えて欲しいのですが、 ・なぜ行列、行列式を利用しなければいけないのか。  それは微分方程式や、グラフ理論などをある意味「視覚化」  するものなのか。私には余計ややこしい気がします。 ・行列式や、固有値、写像や基底というのは、  この分野を理解する上で、どういう役割があるのか。  あるいは、お互いにどのようなつながりがあるのか。 大学数学に関してはまだまだ初心者なので、 なるべく解りやすく説明していただけるとうれしいです。 (本は数冊読んでみましたが、どうしても全体像がつかめません。 数式などは提示しなくてもいいので、「言葉」の面での 説明をお願いします。)

  • 行列のスペクトル分解について

    自分が持っている参考書に、見たことないスペクトル分解が載っていました。 「行列Aについて、固有値をそれぞれα、βとし、それぞれの固有ベクトルをベクトルu、ベクトルvとする。 A^n=α^nP+β^nQの、行列P,Qを求める。 f(x)=ax^n+bx^(n-1)+・・・+yx^1+zx^0とし、f(A)=・・・・=f(α)P+f(β)Qとなる  (ここまではわかります) したがって、g(α)=1かつg(β)=0となる多項式g(x)が見つかればP=g(A)、         h(α)=0かつh(β)=1となる多項式h(x)が見つかればQ=h(A) よってP=A-βI/α-β,Q=A-αI/β-αとなる」 この、「g(α)=1かつg(β)=0となる多項式g(x)が見つかればP=g(A)、         h(α)=0かつh(β)=1となる多項式h(x)が見つかればQ=h(A)」となる多項式はP=x-βI/α-β,Q=x-αI/β-αだと理解できるのですが、なぜP、Qを求めるのにf(x)を考え、さらにg(x)、h(x)を考えたのかわわかりません。 どなたかご教授下さい。お願いします

  • 線形代数学の参考書

    線形代数学の参考書で、お奨めのものを教えてください。問題が多く、その解説が詳しいものを探しています。偏差値がそれほど高くない、4年制の大学工学部で、専門基礎としてならう、線形代数学?です。2,2行列で、固有ベクトルをあわせた2,2行列(名前がわからない)を使って、連立微分方程式を解く、などの内容を勉強します。また、定理の証明などは載っていなくて構いません。

  • 線形代数学の問題演習書

    線形代数学で、AE-λE=0から固有値を求め、P^-1AP等を使って連立微分方程式を解く問題(AE-λE=0の行列式で、λに関する二次方程式が、異なる二解を持つ場合、重解を持つの両方の場合を含む)が載っている本を探しています。問題ある程度載っていて、その解説が詳しいものをお願いします。まだよく勉強をしていないので、うまく表現できなくて申し訳ありません。全ての大学で、大体内容は同じだと思うので書きますが、線形代数学2の分野です。ちなみに工学部。

  • 独立成分分析の画像への適用

    画像に対して独立成分分析(ICA)をしているような論文を見かけました。 しかし、私が知っている範囲では音声に対する分析に用いているのがほとんどです。 そこで画像に対するICAについて調べようと思ったのですが、中々解説しているサイトや書物はなく、思ったほど理解が進みません。 画像に対するICAについて詳しく解説している書物やサイトについて、どなたかご存知でしたら教えてください。 お願いします。