• 締切済み

統計的手法(特に検定)について

統計的手法(特に検定)の必要性とはいったいなんなのでしょうか???? 課題レポートの一部なのですが、さっぱり分からなくて困っています。 知っている方、よろしくお願いします!

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 私は、全てのデータを使える統計と一部のデータしか利用できない推計を分けて考えます。  例えば、1年1組と1年2組の身長の比較なら、全員の身長を測定して、1mmでも差があれは、そちらのクラスの身長が高いと結論できます。しかも、その結果は、誰がやっても同じになります。これを統計と定義しています。  集団の性質を表すときに、一言でいうには、その集団を代表する値があれば、便利です。その代表する値として、平均値、中央値、時には4分値なども使います。すなわち、統計とは、集団を一つの数値で表す必要性があるときの手段です。  しかし、全員のデータを利用できない場合があります。例えば、日本人とアメリカ人を比較するには、人数が多すぎます。蛍光灯の寿命を旧製品と新製品を比較する場合、全ての製品で検査すると売る為の商品が残りません。  こんな場合は、それぞれの集団から代表を選んで(無作為抽出といいます)計算します。これを私は推計と定義しています。  例えば、集団AとBの比較には、平均値が使われる場合が多いのですが、集団の中のサンプル数が多い場合は、サンプルの選び方によっては(恣意的に選べば)、Aが高くなったり、Bが高くなったりします(偶然かもしれないわけです)。  恣意的でなくても、選ばれるデータは違います。サイコロを3回振った場合、目の出方が毎回違うことからも明らかです。そこで、サンプルを無作為抽出して、「平均値の差は偶然ではない」ことを示すことになります。その比較の方法が検定(この場合は、t検定が多い)なのです。  検定で一番難しいのが、「有意差」だと思います。私の考えで良ければ続きを書きますが。

noname#12673
noname#12673
回答No.1

例えばサイコロを転がして、同じ目が2回続けて出たとします。まぁ、ありえないことではないですよね?3回目も同じ目がでました。ちょっと変だな?と思い、4回目も振ってみたら、やはり同じ目だった。 「このサイコロおかしくない?」 そう思いますよね? そう思ったあなたの頭の中にはすでに検定の考え方が出来ています。(統計的仮説の検定) 「このサイコロの目は等しく1/6づつの確率で出るはずだ。」はじめはこう思っているはずです。これを帰無仮説といいます。 それで、同じ目が4回も連続で出たことでこれに疑問を持つようになるはずです。「このサイコロの目は等しくない」、これが対立仮説です。 そう考えて、サイコロの目が4回連続で出る確率を計算すると1/1296になりました。 あなたは、「めったに見られないものが見れた」って喜びますか? ふつうサイコロの方を疑うでしょう。 このロジックが検定です。 「おかしい」という主観に、確率という客観的な基準を与えてくれるものです。 これが無いと、「たまたま起こったこと」と「何か変化があって観測されたこと」の客観的区別が出来なくなります。 サイコロの目が4回連続で同じ目が出ることも、1/1296の確率で起こり得ます。 でも数字として示すのと、そうでないのとは説得力が違いますよね。

関連するQ&A

  • 検定統計量の証明

    こんにちは 今大学のレポート課題でわからないことがあるので教えてください! 検定統計量は(x-μ)/√(ρ^2/n)で表わされるのですが こう表わされる理由を答えよという問題です。 よろしくお願いします!

  • 検定統計量について

    検定統計量と検定について(http://www.aoni.waseda.jp/abek/document/t-test.html) 1. 検定の方法は,T検定,F検定,J検定などの手法をみかけるのですが,違いがいまいち 分かりません.これらの違いは,考える確率分布が違うということなのでしょうか? 2. 各検定法(T検定,F検定,J検定など)と検定統計量のかかわりがよくわからないのですが, たとえば,T検定をする場合の平均の検定統計量とF検定をする場合の平均の検定統計量 は同じなのでしょうか?   3. 検定についてまだよく分かっていないので,検定の仕方を正しく認識しているか怪しいですが, 検定は,仮説に応じて検定統計量を定義してから,その検定統計量を計算し, P値を求めることで仮説が有意か否か判定するのですよね? なので,最終的にどの検定(T,F,J検定)もP値を求めて有意か否か判定するので, 検定統計量さえ正しく定義できれば,T検定,F検定,J検定など,どの検定法 を使おうとひとつの検定の方法でどんな仮説の検定もできると考えてよいのでしょうか? それとも用途に応じて検定法を使い分ける必要があるのでしょうか? 回答よろしくお願いします。

  • どの統計手法を使うのかわかりません

    修士研究真っ最中のものです。 データ分析で迷っています。 以下のような場合、どのような統計手法を用いるべきでしょうか。 二つの集団(生徒と先生)のある行動パターンを知るため、アンケートをとって因子分析し、因子を抽出した これらの因子に、両集団でどのような差があるのか。とくに有意に高い、低いなど際立つ因子はあるか。 ----これを知りたいときに用いる検定はどのようなものなのか、はっきりとわかりません。 ご指南いただけましたら幸いです。 どうぞよろしくお願いいたします。

  • 検定手法の選択

    検定手法の選択 統計に詳しくないので、分かりやすく教えていただけると助かります。 この質問は既出なのですが、カテゴリを間違えたため、再度質問しています。すみません。 面接により、発話プロトコルを得ました。 そこからあるカテゴリーにあてはまる発言数をカウントし、2群間で比較しようと思っています。 しかし、サンプルが少なく、一方は8、もう一方は4です。 この場合、発言数(の平均値?中央値?)の差をみたいのですが、どの検定手法をとればよろしいでしょうか? そもそも、サンプルが少なすぎて無意味なのでしょうか? 教えてください。

  • 統計手法について

    統計手法について詳しく書いたサイトないでしょうか。 CPKの考え方を知りたいのですが。 検索しても統計ソフトばっかりゴロゴロひっかかるし… 本や行くのめんどくさいし…(わら

  • 統計手法の選択と変更

    統計の初心者ですが,よろしくお願いいたします。 ある薬剤を投与した時(A群)とある薬剤を別な飲み物で投与した時(B群)においての尿中成分を経時的に採取し,時間毎(1時間・3時間・6時間・12時間)に有意な差があるか・・,というのを行いました(個体は同じなので対応有り。n=10)。 1~6時間におけるA群とB群の比較はKolmogorov-Smirnov検定・等分散のF検定により正規性・分散が等しいと言えたので,パラメトリックを使いました(paired-t test)。 しかし,12時間の時だけが正規性はあるのに,分散が異なってしまいました(F検定により有意水準5%で母分散が等しいと言えなかった)。 わからないことは 1) 対応のある場合で,分散が異なる場合に用いる統計手法は?   (対応が無ければWelch's t-testだと思うのですが。ノンパラのWilcoxonの符号付順位和検定を使うべき?全てpaired-t testは使わず、別な統計手法で統一すべき?) 2) 論文に統計手法を記述する際の適切な表現方法は?   (統計解析にはpaired-t testを用い,12時間値のみ分散が異なるので**検定を用いた)と細かく書いた方が良いか?? 3) n数が極端に少ない場合(例えばn=4),ノンパラが適切でしょうか。KS検定・F検定では正規性と等分散がいえるのですが、あくまで例数が少ないので、。。 宜しくお願い致します。

  • 変化の違いに対する統計手法

    1年に1回質問紙調査(点数がつく)を行っています。 1年間にある事象が起こった人と起こらなかった人がいます。 事象が起こった人と起こらなかった人で、ある事象を挟んだ前後の質問紙のスコアの変化に違いがあるかどうかを検定したいと思っています。 どのような統計手法を用いれば検定できるでしょうか?よろしくお願いします。

  • 統計手法について

    こんにちは。私は大学で心理臨床を学んでおり、今後は大学院受験に進学したいと思っています。そこで研究計画書を書く必要があります。やりたいことは明確になっているのですが、どのような統計手法を使用すれば最もデータを繁栄できるかわかりません。受験までの時間が迫り、切羽詰りながらも何かよい手がかりはないかとネットで検索していたところ、ここにたどり着きました。お忙しいとは思いますが、もしよろしければ、何かアドバイスが頂けたら幸いです。 質問は以下通りです。 『職業ストレス(環境要因)と職業への関与(個人的要因)が、ストレス・コーピング(調整要因)を介してバーンアウト(ストレス反応)に及ぼす影響を調べる。』 このモデルを調べるにはどのような統計手法があるでしょうか。教えてください。

  • 統計学手法について

    あまり検定が得意でない会社員です。 詳しい方いれば教えてください。 4つの異なる餌を用いて、虫を飼いました。 ちなみに餌の違いは、加える添加物の濃度(%)の違いです。 最終的な生存率(死亡率)を調べているのですが、 その際に餌の違いによる生存率に有意差があったかどうかを 統計的に調べたいのです。 試験区は、一つの飼育容器に50匹で、それを3反復。 結果(生存数は50匹中) コントロール(無添加)=40、38、37 A=38、42、36 B=20、19、22 C=20、21、24 となりました。 難しいのは、コントロールにおいても一部死んでしまう虫がいるということです。 こういった場合どのような統計処理が適するのか、 この情報でお解りの方、いればアドバイスお願いします!

  • 統計検定について

    統計で有意差があるか検定しようと思っていますが、どの検定を使えばよいかわかりません。 例えば、塾に行っている群と塾に行っていない群で合格・不合格に有意な差があるか検定するにはどうすればよいのでしょうか。また、サンプル数はどのくらいあれば統計的に信頼性があると言えるのでしょうか。 統計処理初心者のためよくわかりません。よろしくお願いいたします。