• 締切済み

統計の質問です.

統計の質問です. 例えばの話なのですが 地点Aで降る雨が川Rのあるポイントでの水位の上昇に関係しているかどうか確かめたいとします. 川Rの水位は自動で1時間に10回測定される量的データで,地点Aでの雨は1時間ごとに降ったか降らないかチェックできる程度の曖昧なデータだとします. また川Rの水位は様々な要因で変化すると予想されるがその全ての要因を掴むことはできないとします.(例えば地点Bや地点Cで降る雨だったり,最高気温の高い日に家庭用水として多く利用される等) さらに地点Aで降った雨が川Rの水位に影響を与えるまでは時差があり,その時差が一定でないと予想されるとします(一定ではないもののある程度まとまりがある.しかし1時間以上は差が出ることがある). この様な条件下で「地点Aで降る雨は確かに川Rの水位に影響を与えている」ということを証明するにはどのような統計的手法を用いるのが良いのでしょうか? 現在,地点Aで降る雨のデータを雨が降った場合を1それ以外を0というようにして1時間おきの時系列データに無理矢理置き換え「相互相関関数」というものをつかって考察しています. しかし相互相関関数では川Rの水位が上がったときに一定時間ずれた時点で地点Aに雨が降っていなければ相関は低いとなってしまいます. これでは 雨が水位に影響を与えるまでの時間は一定ではない 川Rの水位に影響するのは地点Aの雨だけではない という条件が反映されていません. このようなケースは統計の世界ではよくあることだと思うんですよ.例えば「不定期に発表される大統領発言が物価に影響を及ぼしているかどうか」とか,「薬剤Aの服用は心拍数に影響を与えているかどうか」とか.それようの由緒正しい解析手法があるのに自分が知らないだけなのではと思うのです. ごちゃごちゃしててすいません,まとめます. 「ある現象Aがある時系列の量的データBに影響を及ぼしている」ことを確かめる解析手法はありあませんか? 以上です,よろしくお願いします.

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 私なら、相関分析を行います。パソコンを使えば簡単です。  ただ、時間のズレをどう処理するか、が問題でしょう。今は、パソコンで処理できるので、試行錯誤で適正なモデル作成して下さい。周囲の河川から流れ込んでも、その地点が、どれくらい影響しているかも推測できます。  ご研究だと思うので、研究者としての倫理上、これ以上のアドバイスはしません。お立場が分かれば、できるかも。  

回答No.1

統計手法については詳しくありませんが、ふと疑問に思った点を指摘したいと思います。 証明の方法を統計的手法によるのはなぜ?本当にそれがベスト(又は唯一の)方法なのか?ということ。 単に影響があるかないかの二択なら、必ずしも統計的手法に依らなくても解決可能なのではないか、と思うのです。例えば流域図を見る、都市部なら下水道や用水路の配置図を見る、実際に近くの川にGPS付きの風船やボートを浮かべる、などなど。既にあるデータを引っ張ってきたり安価な実験をすれば良いのですから楽勝です。なにも見慣れない数式をこね回す必要はありません。 ただし、これが「どの程度」となると、さっぱり分からないとしか私には言えません。ミクロな地点の雨量と河川の水位の相関はちょっとお手上げです。一般的な理論は無いんじゃないかなあと思います。

utyapo
質問者

お礼

回答ありがとうございます. ご指摘の点はまったくですが,川の話はあくまでたとえ話で実際には仕組みがどうなっているかほとんど分かっていないもので,なおかつ追跡調査の類もできないものを調査したいとおもっています. それでもやはり統計手法が唯一の方法でないという点は念頭に置いて他の手段も考えて行きたいと思います. 貴重なご意見ありがとうございました.

関連するQ&A

  • 統計の信頼性

    統計データの信頼性はどのようにして確認したらよいのでしょうか?? 母体数が少なすぎるのはわかっているのですが(5しかありません・・)、これの相関を見たときに「相関がある」という結果が出ました。R2乗は0.9くらいです。でもあまりに信頼性がなさすぎると思うのですが、もし無理やり信頼性を数値で表すとしたらどのような作業をしたらよいのでしょうか?ちなみにJMP使って解析をしています。 どなたか、すごくやさしくわかりやすい回答をしていただけないでしょうか。

  • 統計学の質問です.アドバイスもらえないでしょうか?

    統計学の質問です.アドバイスもらえないでしょうか? 統計学の質問です.気象予測の研究において気温,気圧,日射量,風向,風速,雲量,相対湿度の7項目のうち一つを目的変 数として他の複数の説明変数に対して重回帰分析(各項目1時間ごとのデータ)を行った.気温を目的変数としたとき,気圧が最 も影響度が高かく,日射量は低かったが,普通に考えても日射量がもっと影響を与えるはずだと考える.確かに日射量は日が沈 んでから値は0で,昼間に急に値が上がるのでそのままだと相関関係はとらない.しかし,関係性があるのは確かなので日射量の 値を変換して相関関係をとりたいのですが,どうしたらよいでしょうか?累加日射量の二十四時間移動平均を使っている過去の 論文の例もあるのですが,よく分かりません.なにかアドバイスいただけるでしょうか?

  • 質問です

    あるボートは流速一定の川をX地点からY地点に下るのに20分かかり同じ川をY地点からX地点に上がるのに30分かかる。このボートが、川の流れの無いところでX~Yと同じ距離を進むとすると、このときかかる時間は何分か。 回答解説お願いします

  • 統計

    統計 データ(x1,y1),(x2,y2)・・・・,(xn,yn) に大して標本共分散Sxyと標本相関係数Rxy があるとき -1≦Rxy≦1の示し方と、 Yj=aXj+b(a≠0)のとき|Rxy|=1の示し方を教えてください。

  • 統計手法について

    こんにちは。私は大学で心理臨床を学んでおり、今後は大学院受験に進学したいと思っています。そこで研究計画書を書く必要があります。やりたいことは明確になっているのですが、どのような統計手法を使用すれば最もデータを繁栄できるかわかりません。受験までの時間が迫り、切羽詰りながらも何かよい手がかりはないかとネットで検索していたところ、ここにたどり着きました。お忙しいとは思いますが、もしよろしければ、何かアドバイスが頂けたら幸いです。 質問は以下通りです。 『職業ストレス(環境要因)と職業への関与(個人的要因)が、ストレス・コーピング(調整要因)を介してバーンアウト(ストレス反応)に及ぼす影響を調べる。』 このモデルを調べるにはどのような統計手法があるでしょうか。教えてください。

  • 統計について

    統計に関する質問です。 音響特徴量 (データ数:10 以下A群と呼ぶ) 脳波 (データ数:5 以下B群と呼ぶ) 感情価測定尺度(データ数:6 以下C群と呼ぶ) 一時的気分尺度(データ数:6 以下D群と呼ぶ) 質問1 A群とそれぞれの他群(B群、C群、D群)の関連性を分析し、音響特徴量が持つ感情価・心理的影響を調査したいと考えています。データ数が異なるグループ間での関連性を分析する適切な方法は何でしょうか? 質問2 B群、C群、D群と被験者の背景情報(年齢、性別など データ数:6)との関連性も分析したいのですが、分析が複雑化する可能性があることから、省略した方が良いでしょうか? 質問3 A群のデータの組み合わせが持つ相互作用についても調査したいと思います。この目的に適した分析手法を教えてください。 何卒よろしくお願いいたします。

  • 統計についての文を添削してください

    統計のことはぜんぜん理解していないものです。 どなたか私の文を添削していただけないでしょうか? 言葉遣いがおかしいとか、意味が違うとか指摘していただけると助かります。 サービスの品質改善というテーマで翻訳をしていたのですが、調査をおこないデータを整理して結論をだすために、統計の手法を使うことができる、という部分がでてきて困っています。 ネットでいろいろ学習??しましたが、あっているかどうかまったく自身がありません。 よろしくお願いいたします。 カイ二乗‐2つの変数の間での関連を決めるための統計技術。(1)観察されたデータが期待とマッチするかどうかを見る、(2)一方の変数の分布がもう一方の分布と関係があるかみる。 t-検定-サンプルが同じ人口から選べれているかを見るため、2つの個別サンプルの平均や割合を比較する統計技術。(3つ以上のサンプルの平均をテストするには、分散分析が使われます) 重回帰-複数の変数の値の変化によって、1つの変数の変化の値を予測するための統計技術です。 クラスタ分析-対象(学校/場所/物など)を特定された数の排他的グループ(内部的に同種)に分ける統計技術。 因子分析‐相関関係をもつ変数の大きなセットの要因を決める統計技術。 判別分析-人や物を2つ以上のカテゴリーに分類するための統計技術。 カイ二乗による相互作用の自動検出方法(CHAID)‐分岐方法を使って、因数のなかの相関と見つける統計技術。 以上です。

  • 相関を求める時の、はずれ値のはずし方

    こんにちは 現在、ある2つのデータの相関関係を調べています。 そのデータを散布図にしたところ、数個はずれ値が確認できました。 これのはずし方をご質問させてください。 はずれ値のはずし方について、標準偏差を考えるやり方などがありますが、そういった統計的手法ではなく、単に『はずしてみて分析してみた』というのは、ありなのでしょうか? 私は、この2つのデータの相関があることを言いたいだけで、それ以上に詳しい分析を行うつもりはありません。 しかし、統計的におかしはことはしたくありません。 そこで、話の流れとして、 『散布図を作って、相関係数を求めてみた。相関があった。けれど、はずれ値もあった』  ↓ 『はずれ値っぽいのを外してみて、相関係数を求めてみた。やっぱり相関があった』  ↓ 『いずれにせよ、相関はある』 はずす値がはずれ値であるかどうかが、主観によってしまうので、統計的にどうなのかな?と思ったので、ご質問させていただきました。 けれど、結局、はずしても、はずさなくても相関があるのなら、統計的にも話しの流れ的にも問題はないのでしょうか……。

  • 有意差が生じているかどうかの統計手法を教えてください。

    有意差が生じているかどうかの統計手法を教えてください。 質問事項は2点在ります。 1.Aというサイトで1年間Bという物質の日平均濃度を測定し、同サイトにおける地上5mと25mとの温位日平均値とで相関が見られた。翌年同様の測定を行ったが、同じ程度の有意性が認められるのか確認するにはどのような手法を用いればよいのか。 2.1999年度に500地点で測定されている物質Xと物質Yの日平均濃度値を用い、Y=aX^bという回帰式が求められた。10年後に再度同様の手法で回帰を求めて得られたY=AX^Bという式は10年前に求めた式と有意な差が見られるか 以上です。 数学に疎く、理解できなくても使えれば良い、という状況下におります。 ご見識のある方のアドバイス、よろしくお願い致します。

  • 統計学についてお聞きしたいです.

    現在,統計ソフトRを使って,プログラムを書いています. 内容は多重共線性問題のあるデータを主成分回帰分析を使って,解決するということをやっています. データはRを使って,変数を数個を発生させ,その中の3つの変数を足すと0になるというデータを使っています.相関関係が高い場合のみの多重共線性のデータは自分のプログラムでうまくできたのですが,線形関係をつくると多重共線性のある変数が0に近づいてしまいます.実際は1に近づくはずなのですが.それがなぜだかが分かりません.どなたかご教授お願いします.線形関係の作り方は平均1, 分散0のデータを発生させ,そのデータをエクセルを使って,並び替えて作ります.その時データは平均1,分散0のままです.また,ヒントとなるようなプログラムやコマンドなどでも全然構いませんのでお願いします.今,3カ月かかってできません.本当に困っているのでお願いします.