• ベストアンサー

サンプル選定、T検定とF検定について

サンプル選定の仕方で悩んでいます。詳しい方、教えて下さい。統計初心者ですので、表現の仕方などが間違っているかもしれません。 相関関係のあると思われる2群のサンプルについて、適切なサンプル(相関が認められる)のみを選び出したいのですが、方法は次の通りでいいのでしょうか。 (1) F検定をして、母集団の分散が等しい場合と異なっている場合に分ける。 (2) (1)の結果を基にT検定でP値を求める。 (3) (2)の結果が5%未満であるものをサンプルとして選定する。 上の方法が間違っていない事が前提ですが、(3)のP値が5%未満になると有意差があるという説明がサンプルとして選ぶべきか選ばないという事を意味しているのか確信がありません。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>方法は次の通りでいいのでしょうか。 書かれていることが、バラバラです。  というのも、相関関係は、AとBとの関係の有無、例えば身長と体重に関係があるか否かを判断する者。散布図を描き、相関係数と回帰式を算出します。 t-検定と、F-検定は、2群(1年生と2年生など)の平均値に、有意差があるか否かを判定するものです。 >適切なサンプル(相関が認められる)のみを選び出したいのですが これは、都合の悪いデータを棄てる、ということで、統計学ではやってはならないことです。ただし、異常と判断されるデータを棄てる棄却検定というのは認められていますが、初心者が適正にやれるとは想えません。 1) どのようにしてデータを集めたのか、 2) 平均値の差を言いたいのか、両者に関係があることを言いたいのか、目的をハッキリさせ無い限り・・・。

ellele22
質問者

お礼

訳の分からない質問にご回答下さりありがとうございました。 過去のデータ(株価の動き)を基にある事項が起こった時に異常リターンが発生するか調べようとしています。過去のデータ(2集団)に相関関係にあるかを吟味し、相関関係にないと思われるサンプルデータを除きたいと思うのです。 回帰分析後、決定係数を出したのですが、どれも低くそのデータを除くのは止め、他に方法はないかと調べておりました。 T検定は相関関係を調べる手段にはならないんですね。的外れな事をやろうとしていました。

その他の回答 (2)

  • ecotomed
  • ベストアンサー率56% (34/60)
回答No.3

 特定の銘柄について日々の株価推移を予測するのは不可能ですが、 分野別だったり過去のデータにおける変動要因の推定はある程度可能だと思います。  こんな分析に意味があるかどうかはさておき、夏季の気温上昇と飲料メーカー株・家電メーカー株などは分析するまでもなく正の相関が認められます。また、M&Aや新技術の発表を期に上昇する銘柄は腐るほどあります。その他としては金利の変動に伴う株価の上下なども国際間の金利水準の相対的変化においては意味があります。  どういう分析をしようとしているのかいまいちピンとこないので適当なことを書いていますが、個別具体の事象を分析するのは不可能に等しいので、取り組まれるのであればやはり大まかな流れにとどめるのが良いのではないでしょうか? 技術的なことに関しては詳しくないのでパスさせていただきます。 ってそれじゃ役には立ちませんね(汗

ellele22
質問者

お礼

アドバイスどうもありがとうございました。 その後、Pearson検定が出来るソフト試用版を見つけ試してみました。相関関係について目安になるようです。全てを検定するのは出来ないので、怪しいものをピックアップして検定をする事にしました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 株価について、私がやった分析は、横軸に年度の一人当たりのGNP、縦軸に平均株価を取りました。  その散布図を描くと、一目でバブル期は異常に上がっている、と判断できました。この場合、バブル前の回帰式と、バブル期後の回帰式が異なることを示せば良いのですが、私にとってはどうでも良いことなので、やっていません。 >相関関係にないと思われるサンプルデータを除きたい  散布図で、回帰式から外れる点については、回帰式の上下に±2σの範囲を取り、その範囲から外れる点は、棄却するというのがあります。  2σは、正規分布をしていれば、95%のデータが入るわけですから、まあ納得できます。2σの範囲は、spssなどの統計ソフトを利用すれば、簡単に作図されます。 >回帰分析後、決定係数を出したのですが、どれも低く 回帰式で、原因と推定される事項については、いろいろなことが考えられます。この場合は、重回帰分析という手段をとるのが一般的です。それでも、人間世界の事象についしては、決定係数が0.5より大きくなるのは大変でしょう。私の場合は、年度ごと、すなわち、マクロですので、まだ傾向が見えました。  株価は、毎日が勝負。これはミクロ経済ですよね。プロ野球でも、年間を通せば、上位チームは予想できます(評論家は、必ず外してくれます)が、今日の勝負は、予想が困難だと思います(野球賭博では可能とか)。  株は、上がるか下がるかの丁半バクチ、さいころの出目を予想するのに似ているので、株についての分析は進めていません。私より賢い人が、大型コンピュータを使っても、大損する世界ですし、・・・。「投資」『投資』、と騙されている人がいますが、バクチであることは、経済学部の教授に確認済みです。  ちなみに、相関分析と回帰分析は、世間では同一視されています。が、相関分析は因果関係の判定要因の一つ(何故それが原因になるのかの説明が必要)、回帰分析は、予想が当たればそれで十分、因果関係は不要です。

ellele22
質問者

お礼

再び投稿頂いてありがとうございました。 仰るとおり、数々の要因があるので株価予測が当たる確立は低いと思います。 私のは論文の実証分析のためなので、株価があるイベントによって上がったと認められるという程度でいいのですが、集めた過去のデータに相関関係がないのであれば、それを除かないとイベント前後の比較にも影響が出るのではないかと思いました。 >散布図で、回帰式から外れる点については、回帰式の上下に±2σの範囲を取り、その範囲から外れる点は、棄却するというのがあります。 説明不足でしたが、サンプル群が700件程度あり、それぞれに回帰分析後、決定関数を求めています。700件それぞれに相関関係があるのかを調べ、低いものは除きたいと考えておりました。そして、その平均値をもって株価の動きを分析したかったのです。 どのようにするのか他にも色々と調べたいと思います。

関連するQ&A