• ベストアンサー

データのクラスター分析?

私は今、ある高原の景観、音、空気成分濃度などをすべて定量化し、各エリアの特徴を見つけたいと思っているものです。 たとえば、このエリアは「静かでガス成分が濃い」などと・・ この分析はクラスター分析を使用すれば求められると、先人の論文を見て見つけたのですが、いまいち方法がわかりません。 エクセルのマクロなどでできることはできるのですが、これでいいのか・・・汗 画像で乗せますが、正規化をしたほうがいいということなのですが、 変数の一つに+と-のデータが入るものがあり、このまま正規化していいのかも疑問です。 何かアドバイスしてくれる方がいましたらよろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 仰る通り、クラスター分析もひとつの手だと思います。  非階層的クラスター分析を使った場合、温泉を幾つかのグループに分類しても、それぞれのグループの特徴を旨く言えるかどうかが問題になるかも知れません。  階層的クラスター分析をやって、分岐が生じるところに着目して「その分岐では、どういう特徴でクラスターを区別しているのか」を言語表現にしてみる方が易しそうに思います。が、何階層も分岐していくと、言語表現が複雑になっちゃいそうです。  一方、主成分分析を使うのも手だろうと思います。データのばらつきを最も良く説明するような共通の尺度(1~3個ぐらい)でサンプルを測った散布図を作る。そうすると、全体の分布の様子と、各温泉の大まかな傾向がとても見やすくなります。  これらの尺度は測定データの線形結合で表される変数であって、尺度同士は互いに直交しています。もともとN個の変数があったものをたとえば2個の尺度だけで表現するということは、N次元空間中の点(ひとつの点がひとつの温泉)を2次元平面に射影することに他なりません。さて、これらの尺度に旨い名前を付けてやれば、温泉を大まかに分類する言葉が構成できたことになります。  次に、各温泉について、これらの尺度では表せない特徴を考えます。それにはN次元空間において、その点から、射影した2次元平面への距離に着目する。この距離が小さい温泉は、(2個の尺度で表される以外の)独自の特徴というものはさして持っていない。しかしこの距離が大きい温泉は(2個の尺度だけでは表せないような)独自の特徴を持っているんで、それを表す標語を作ってみる。  なお、どの手法も、取り上げたサンプル全体の中での相対的な特徴を見ている(だから正規化しても良い)のであって、すなわち、サンプルに何を含めるかで結果が違ってくる。客観的な分析だと言えるほどのものじゃありません。 > このまま正規化していいのか いいです。

gouryella
質問者

お礼

返答遅れてすいません。 アドバイスを参考にして、階層クラスター分析の結果と主成分分析の主成分得点の分布図を照らし合わせて、言語表現による分類分けを行うことができました。 ありがとうございました!!

関連するQ&A

  • 数式がわからなくてもSPSSで分析できますか?

    論文作成のために、調査でーたを分析します。SPSSを使おうと思っています。因子分析、主成分分析、クラスター分析をするつもりです。 文系で数学めちゃ苦手です。数式がいまいち理解できなくても、以上のような分析をSPSSでだすことができますか。先輩方教えてください。

  • ガスクロマトグラフイ定量分析

    ガスクロマトグラフイで絶対検量線を引いて定量分析をしました。この時、未知成分の濃度をクロマトパックで計算し、データとして印刷することがでますか?自分で計算しますか?

  • 空気採取の方法・・・

    私は今、研究室で森林の空気(フィトンチッド)を採取して、GC/MSで分析しているものです。 ガス採取器(MP-Σ300N)を使って、チャコールチューブに空気を吸着させて、それを再度、二硫化炭素を溶媒として溶出させ、GC/MSで定量分析をしているのですが、先人の論文などに示されている、数十ppbの濃度が検出されません。 湿気に考慮して、チャコールチューブの先に、シリカゲルをつけているのですが・・。 誰か、同じような測定をしている方がいましたら、助言を頂ければ幸いです。

  • 主成分分析の使い方について

    主成分分析などの統計的手法を勉強中の学生(環境学分野)です。 ある論文で、下記の内容を目にしました。 私には、どうして、このデータによって、この目的が達せられるのかがどうしても理解できません。 どうかご教授のほどお願いいたします。 目的 農地が持つ29種類の機能を集約化すること。 方法 1.602人に対してアンケートを行い、29機能を「高くもつ」から「まったくもたない」の5段階評価尺度で評価してもらう。 2.アンケートの結果を中間順位法により順位統計量に変換する。 3.主成分分析を行う。 4.VARIMAX回転を行う。 5.第10因子までの因子負荷量の算出を行う。 6.因子負荷量によるクラスター分析を行う。 結果 29種類の機能は8種類に集約された。 人がその機能を「高くもつ」、「まったくもたない」と感じる“感じ方の傾向”と、“機能の性質”は別のことなので、機能の集約化にこのようなアンケート調査の結果を用いることはできないのではないかと、私には思えました。 けれど、結果として示されたクラスター分析のデンドログラムを確認してみると、植物保護機能、動物保護機能、土壌微生物保護機能などが「生物・生態系保全」のクラスターに含まれ、情操教育と精神安定化などが「保健休養」のクラスターに含まれるなど、機能の性質に関する一般的な感覚を反映したものになっていました。 主成分分析を駆使すれば、そういったことも可能なのでしょうか。 ご助言よろしくお願いします。

  • 酸素濃度計異常指示、原因は臭素

    燃焼ガスの酸素濃度計がオーバースケールしてしまいました。 ガス成分の分析したところ臭素濃度が高く、これが原因と判断 しました。 どなたか、臭素対策がされた酸素濃度計をしりませんでしょうか 質問カテゴリー違反でしたらごめんなさい。 適当なカテゴリー(プラントエンジニアリング)がありません できたので、このカテゴリーで質問させていただきました。

  • ハンディータイプのガス分析機器

    お世話になります。 現場にて装置間あるいは各種ガスユーティリティーの配管接続施工後にガスパージを行い内部置換をしていますが客先より、残留ガスの成分を知りたいのでザックリした数値で提出を要求されております。強制ではないのですが、これまでは酸素濃度計を用いた本当に簡易的な計測?のみで判断しておりましたが今後、他の客先でも要求されそうなのでこの際、分析機器の購入を検討しております。分析レベルや定期的な校正、また現地での取り扱いの点でもハードルが多く機器選定に困っております。簡易的なガスクロ機器などをご存知の方いらっしゃいましたらお願いいたします。

  • 既知サンプルが得られない場合の真度の求め方

    塩化ビニル樹脂に殺虫剤成分が数十%程度入った製品の殺虫剤成分の含有量分析を試みています。この分析方法は、殺虫剤指針(改訂予定)というものに記載されており、サンプル片をアセトンで数時間抽出後に、ガスクロを用いて内部標準法で定量するといった流れです。この方法を用いて分析する場合、一応バリデーションを行おうと考えておりますが、真度を求める際に既知濃度のサンプルが得られません。どのような方法で真度を求めるのが良いでしょうか?ご教授ください。

  • 有機化合物を吸着しないシリカゲル

    私は、実験で森林ガスを活性炭に吸着して回収し、ガス成分の分析を行っているものなのですが、回収の際、湿気のおい森林などでは、吸着させる活性炭に水分が吸着してしまい、吸着量が減少してしまいます。 そこで、回収の際、シリカゲルを通して活性炭にガスを採取する方法をとっているのですが、これでは、シリカゲルにガスに含まれる揮発性有機化合物(特に森林ではフィトンチッドと呼ばれているもの)も吸着してしまい、正しく定量できません・・・。 そこで、有機化合物を吸着せずできれば水分だけ吸着してくれるシリカゲル、又はそれに変わるものはないのでしょうか?? 何か情報がありましたらよろしくお願いいたします。

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • ITRS記載のウェハ環境に求められる環境基準の濃…

    ITRS記載のウェハ環境に求められる環境基準の濃度表記について 半導体やクリーンルーム環境について勉強中の者です。 国際半導体技術ロードマップの歩留まり改善の項目にある、環境濃度数値についての質問があります。 この資料における、酸性ガス濃度やアルカリ性ガス濃度[pptM]に記載している数値は、どうやって換算されているのでしょうか?(有機ガス濃度[pptM]に関してはヘキサデカン換算を使用しているとの記載がありました) 無機系の環境濃度の分析結果は、成分別に記載されているのものしか見たことが無かったので読んでいて疑問に思いました。 また、半導体業界もしくはクリーンルームでは、濃度単位の表記は質量ppb等が一般的なのでしょうか? 今後、数値の読み違いや勘違いを無くす為にもご存知の方がいらっしゃいましたら、御教示願います。