• ベストアンサー

「主成分分析の結果から一次元構造が確認される」とは分かりやすく言うとど

「主成分分析の結果から一次元構造が確認される」とは分かりやすく言うとどういう意味なんでしょうか? 今扱っている論文に「主成分分析の結果から一次元構造が確認される」という言葉が何度か出てきます。 何となく研究の正当性を主張するのに使っているというのは分かるのですが、詳しい意味がよく分かりません。 結局一次元構造とは何なのでしょうか? 分かる方、教えてください><!

noname#153267
noname#153267

質問者が選んだベストアンサー

  • ベストアンサー
  • cyototu
  • ベストアンサー率28% (393/1368)
回答No.1

私は数学を普段から使う専門家です。全体の文章を読まずにこれだけの文章では情報が少な過ぎて、正確な意味は分かりません。しかしながら、これだけの文章で想像出来ることは、以下の通りです。 普通、ある量(変数とかパラメーターと呼ばれる)を横軸に取って変化させるとそれに対してある量が変化するとき、その値を縦軸に取った平面内で、その図が大体一本の直線や曲線の上に乗っている場合に、それは一次元的構造を持つと言います。ところが、直線や曲線ではなく、平面的にぼーっと広がって分布してしまう場合、それは最早一次元的ではなく、2次元以上の多次元的構造を持つと言います。多分、主成分をそのようにある変数なりパラメーターを変えて図示してみたら、直線ないし曲線上に乗っているように分布していたということではないでしょうか。 具体的には例えば、ある集団の人間の身長を年齢を変数と考えて図示してみると、もし身長のその集団での平均値を画くと、年齢を大きくして行くと最初は右上がりに直線状に増えて行きますがそのうち成長が止まって平になって行く。従って全体の図は上に凸向きな一本の曲線を画くはずです。従って、この場合この図は一次元的構造を持っています。ところが、身長の平均値ではなくて、各々の人の身長をその集団に対して一枚の図の中に画くと、与えられた年齢で皆の身長は平均値の回りにばらつきがあるので、一本の曲線上には乗らず、その平均値の回りにぼーっと広がった図になります。この時には、その図は一次元的構造を持っていないと言います。 この説明は、果たしてお役に立っているでしょうか。

noname#153267
質問者

お礼

回答ありがとうございます。 最初の説明はちょっと難しかったのですが、具体的な説明の方のおかげで何となくわかったような…気がします(すいません、私は数学が本当に苦手なので;)。 つまり、相関関係を図にしてあらわしたときに一本の線で表せられるときに一次元的構造を持っているということでしょうか?

その他の回答 (2)

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

多変量データというのは分かりますか? X1, X2, X3, ..., Xpという、要するにたくさんの変数があるようなデータセットのことです。これを1次元、2次元、3次元、といった言い方をすることができます。 例えばX1という変数1つなら数直線上に表現できますし、X1とX2の2変量ならx軸とy軸の2次元上に表現できます(散布図がこれです)。さらにz軸を加えた3次元(X1, X2, X3という3変量)でも表すことができるでしょう。しかし、残念ながら4次元以上は図として表現できないので(つまり頭の中でも想像できないので)困るわけです。そこでより低次元で多変量データを表現してあげようというのが主成分分析なのです。 仮にX1, X2, X3, X4という変量があったとして、これを図で表現しようとしてもできないでしょう? だから主成分分析でこれらの多変量データから新たな合成変数を作り出すことで、4次元のデータをより低次元(一般的には2次元)で表現しようとするわけです。 だから1次元構造であったということは、多変量データから新たな1つの合成変数が作り出されたということです。なお、この合成変数のことを主成分というので主成分分析といいます。

  • vzb04330
  • ベストアンサー率74% (577/778)
回答No.2

主成分分析は、多数の変数を、それらが持つ情報をできるだけ損なわずに少数の変数(主成分)に縮約(要約)する手法です。 ご質問のように、「一次元性が確認できた」という場合は、1つの主成分に縮約ができたことを意味しています。 具体的には、1成分を指定して、主成分分析を実施し、固有値、分散ともに十分に高い値が得られ、また、成分行列を見た場合に、各変数がこの1つの成分に対して高い(おおむね、絶対値で0.4以上)負荷を示している場合が、これに相当します。 詳細は、多変量解析についての書物の主成分分析について記述された章をご確認ください。

関連するQ&A

  • 主成分分析について

    主成分分析であるデータを解析したいのですが、主成分分析の手順や意味を詳しく記してあるページなど、ないでしょうか? 調べてみたんですが、実際にデータをどう計算して主成分をだすのかよくわかりません。 よろしくお願いします。

  • 主成分分析について

    主成分分析を行い、主成分ベクトルを求めるためには行列(共分散行列)の固有値問題を 解き、固有値・固有ベクトルを求めればよいですよね。そこで固有値行列(対角成分に固有値 λが並ぶ行列)の固有値の値から累積寄与率を求め適当な次元まで減らすということは わかっています。そこで質問です。 例えば、元々100次元あるとします。固有値問題を解けば、100個の固有値が求まりますよね。 その固有値ひとつひとつに100個の成分を持つ固有ベクトルが存在しますよね。 これを50次元に減らすとします。元々100個固有値を持つ行列から、50個分を用いることになり ますよね。ここで、次元が50になったので固有値と対応する固有ベクトルの成分の数も100から 50に減るのですか?減るとしたら、固有ベクトルの成分からどのように50個取り除けばよいかが わかりません。どうか教えていただきたいと思います。

  • 主成分分析及びクラスタ分析について

    統計について今勉強している者です。 SPSSを用いて分析を実際に行っています。 主成分分析とクラスタ分析というよりSPSSの使用方法になってしまうのですが、 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。 今回自分の場合は4つの主成分になりましたので fac1_1~fac1_4が得られています。 この得られた1~4をクラスタ分析にかけるというのは どのような結果を意味するのでしょうか? 実際にクラスタ分析を行うと鎖効果もなく 非常によい結果が得られたのですが これが本当にクラスタ分析となっているのかが分からなくて。 お分かりの方が見えましたら、ご解答いただけるとありがたいです。 お願いいたします。

  • 主成分分析について

    道路の交差点についての印象を評価するために24の形容詞対(「明るい―暗い」など)を用いて30人にアンケート調査を行いました。アンケートは「横断歩道の有る無し」「信号機の有る無し」などで11種類の交差点についてそれぞれに行いました。これを主成分分析してそれぞれの交差点にどのような印象傾向があるのか調べたいのですが、主成分分析のかけ方に悩んでいます。 それぞれの交差点ごとで30人のアンケート結果に対して主成分分析をかけるのか(これだと一つ一つの交差点に対して抱く感性をまとめていることになりますよね?)、交差点ごとに24形容詞対それぞれの30人分の平均を出して、その平均を使って11種の交差点に対して主成分分析をかける(これだと全ての交差点に対して抱く感性をまとめていることになりますよね?)のか・・・。 主成分分析については少し調べたくらいで素人です。アドバイス等お願いします。

  • 主成分分析の使い方について

    主成分分析などの統計的手法を勉強中の学生(環境学分野)です。 ある論文で、下記の内容を目にしました。 私には、どうして、このデータによって、この目的が達せられるのかがどうしても理解できません。 どうかご教授のほどお願いいたします。 目的 農地が持つ29種類の機能を集約化すること。 方法 1.602人に対してアンケートを行い、29機能を「高くもつ」から「まったくもたない」の5段階評価尺度で評価してもらう。 2.アンケートの結果を中間順位法により順位統計量に変換する。 3.主成分分析を行う。 4.VARIMAX回転を行う。 5.第10因子までの因子負荷量の算出を行う。 6.因子負荷量によるクラスター分析を行う。 結果 29種類の機能は8種類に集約された。 人がその機能を「高くもつ」、「まったくもたない」と感じる“感じ方の傾向”と、“機能の性質”は別のことなので、機能の集約化にこのようなアンケート調査の結果を用いることはできないのではないかと、私には思えました。 けれど、結果として示されたクラスター分析のデンドログラムを確認してみると、植物保護機能、動物保護機能、土壌微生物保護機能などが「生物・生態系保全」のクラスターに含まれ、情操教育と精神安定化などが「保健休養」のクラスターに含まれるなど、機能の性質に関する一般的な感覚を反映したものになっていました。 主成分分析を駆使すれば、そういったことも可能なのでしょうか。 ご助言よろしくお願いします。

  • 主成分分析でのばらつき

    主成分分析において、因子のばらつきが多いところを見つけるには出力結果の何を見ればよいのでしょうか? 例えば、月を変数として、ある商品の価格を全国の都道府県ごとに主成分分析すると、 結果として、固有値、寄与率、固有ベクトル(各月に対して)がでますよね?ここで、全国の都道府県間の価格のばらつきが多い月は何月か見るためには、主成分分析の結果のどこに着目して解釈すればよいのでしょうか? よろしくお願いします。

  • 主成分分析について

    超素人なのですが、主成分分析について困っています。 SPSSの結果で、主成分が9つにもなっています。 3つか、4つかに絞れるように工夫してみなさいと 言われているのですが、どうすればいいのでしょうか。 アンケートの評点データ  35項目 1~5段階評価です。 データ数は100件 不足であれば補足させていただきますので、 どうぞよろしくアドバイスお願いします。 また、わかりやすいページなどありましたら、ご紹介ください。

  • 主成分分析の結果の解釈について

    文献にのっていた色と形の差による印象の変化についての調査を独自に行い、色と形の印象の評価要素をまとめるために結果を主成分分析にかけました。 すると、文献にある結果と第一主成分、第二主成分の内容がほぼ逆転してしまっていたのですが、これはどのような理由が考えられるのでしょうか。 調査方法はSD法でのアンケートです。文献と全く同じ刺激を用いて、参加者の人数、年齢、性別も文献とほぼ同じになるように調査しました。 ただ文献で扱っていた形容詞対は40でしたが、参加者への負担を考えて30に減らしました。(このあたりが結果に影響したのではないかと思うのですが、具体的どのような回答傾向のある形容詞対を用いた、あるいは用いなかったから結果に差が出たのかが分かりません) ご回答いただければ幸いです。

  • 画像の主成分分析

    画像の主成分についての質問です。 http://home.a02.itscom.net/coffee/takoindex.html の内容についてなのですが、事例1 タコ国未知物体の正体は何か というところで海にうつった飛行機の陰の画像を主成分分析し、第一、第二と並べていくと飛行機の主要な形が復元できるとあるのですが、実際にこのようなことは可能なのでしょうか?それとも概念的な例え? また、可能であればどのような操作で(元の画像のデータをこんな行列データにして主成分分析をかける等、)行えるのか具体的に教えてもらえるとありがたいです。主成分分析の操作はだいたいわかるのですが、このような画像の場合にどう入力するとあのような結果が得られるのかがよくわかりません。 困っています。どうぞよろしくお願いいたします。

  • 統計、主成分分析について

     すいません。  勉強中の身なのですが、まだあまり理解度は低いと思われます。  統計学の主成分分析なのですが、  分析内容は  「グループ毎のデータを用意し、そのデータからグループ毎の違いを導き出すことができるか。つまりデータ→グループ分けをして元のグループのようになるか。」  で正しいでしょうか?    例えば、プロ野球選手を  身長、体重、握力、50m走タイム、遠投  などのデータを入れ、  を統計ソフトにかけ、  球団別にうまく分かれるか。  というのは主成分分析ですよね…?  また、上のような主成分分析を試行するのに  考えられる例はどのようなものがあるでしょうか?  データもあれば嬉しいのですが…。