エクセルで統計 ~統計の基礎からわかりません~

このQ&Aのポイント
  • 統計を知らない私が統計学的に証明しなければならない立場となりました。
  • エクセル-アドイン-分析ツール-基本統計量を利用してデータを見ることはありました。
  • 統計学的に「生活指導の効果」を検証するために、30名の腹囲変化量を分析する方法や同一人物の変化の評価について悩んでいます。
回答を見る
  • ベストアンサー

エクセルで統計 ~統計の基礎からわかりません~

タイトルの通り、統計を知らない私が統計学的に証明しなければならない立場となりました。 今まで、エクセル-アドイン-分析ツール-基本統計量を利用してデータを見ることはありました。 以前「t検定?」やり方を聞いたことがあったのですが、何のためにやるのか理解していなかった私は、なんために、何を行ったのか?頭に残っていません。 ~データ~ 同一の母集団30名を検討します A群:生活指導なし1年後:腹囲変化(cm)2007→2008年比較 B群:生活指導あり1年後:腹囲変化(cm)2008→2009年比較 30名分の腹囲変化量を降順で並べ、グラフで比較すると B群に腹囲の増加抑制・減少効果があったように見えます。 このことを統計学的に「生活指導の効果」を検証したいです。 (1) 最初は30名の腹囲変化量から、増加・減少・不変の3群に分けて検証するのか?と思いました。だとしたら、どのように行えばいいのでしょう (2) その後、減少群の中には1cmの減少もあれば15cmの減少もある。これを1まとめに「減少」としていいのか?と素人的な疑問が出てきました。この疑問は解消せず、統計というものを行うのでしょうか? (3) かつ、30名は同一人物(年齢は違うけど)が引っかかってきました。   同一ではない母集団なら腹囲増減を降順で並べて、傾向をみることはありだと思うのですが、同一人物なので、一人一人の変化をみるべきなのでしょうか? と、悩み始めたら、結局何から手をつけていいのか分からなくなってきました。何かきっかけになれば…という思いで「質問」となりました。 最後まで読んでいただきましてありがとうございました。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.3

ANO.2で > 対応のある二群の差を比較したかったわけですね。 と書きましたが、今見直してみると勘違いしてしまったようです。 その場合は、上半分無視してください。

maronaji
質問者

お礼

ありがとうございます。 おかげさまで、何もかも解決できました。 少しですが、以前より知識も増え おっしゃっていることが分かるようになりました。 きっかけをいただきまして、大変感謝しています。

その他の回答 (2)

noname#227064
noname#227064
回答No.2

> 抽出された30名のうち、指導しなかった1年後と指導をした1年後の腹囲を比較・検討します。と言えば…。 対応のある二群の差を比較したかったわけですね。 それならば、 被験者  試験開始前  試験開始後   後-前  1     μ(1)   μ(1)+α+ε(1)  α+ε(1)  2     μ(2)   μ(2)+α+ε(2)  α+ε(2)  :  :  30    μ(30)  μ(30)+α+ε(30)  α+ε(30) ()内の数字は添え字 というモデルになり、後-前について0未満かどうかを検定することになります。 検定方法は誤差が正規分布に従うならば http://aoki2.si.gunma-u.ac.jp/lecture/Average/Mean1.html の方法で、そうでなければ http://aoki2.si.gunma-u.ac.jp/lecture/Average/mpsr-test.html の方法で検定することになるでしょう。 > 正直な感想として「よく分からない」です。 ANo.1だけの説明で理解できるとは思ってはいなかったのですが、わかりにくい説明ですみません。 さらに詳しく書こうとすると数式だらけになってしまい、イメージだけにするとわかったようなわからないような説明になるので、難しいところです。 とりあえず、世の中には色々な検定方法があるけど、検定方法によって前提条件が違うということを理解することと、統計的仮説検定の基本だけは理解しておくだけでも十分だと思います。 > ・・・ですが、ハードルが高いですね(笑) と書かれているように、原理まで理解しようとすると一苦労です。 数式をみるのが苦手な人にとってはかなりの苦行になるでしょうね。

maronaji
質問者

お礼

ありがとうございます。 実は今週末に、学術発表をします。 その時に、私がどのような指導をしたのか?の質問には自信がありますが、 統計的にどうだ?! と突っ込まれることが想定できます。 今のままではあぶない!ということが分かりました(笑) 困りましたねぇ…。冷や汗が出てきましたが、発表前で助かりました。 ラストスパート!がんばります。

noname#227064
noname#227064
回答No.1

最初に用語について指摘します。 > 同一の母集団30名を検討します ここは、「同一の母集団に属する30名について、生活指導ありとなしに分けて検討する」というように書くべきです。 あなたの書き方ですと、全ての例について検討することになるので、検定をする意味がなくなってしまいます。 さて質問に対する回答ですが、まず(1)と(2)については、増加・減少・不変で分けるということは、それだけ情報を捨てることになりますので、変化量そのものを使って解析を行ったほうがよいと思います。 次に(3)については、一人ずつ前後の値が得られていると思いますので、この変化量を使って解析することになります。 得られるデータは、 被験者  試験開始前  試験開始後  1     μ(1)   μ(1)+ε(1)  2     μ(2)   μ(2)+ε(2)  :  m     μ(m)   μ(m)+ε(m)  m+1    μ(m+1)  μ(m+1)+ε'(1)  m+2    μ(m+2)  μ(m+2)+ε'(2)  :  m+n    μ(m+n)  μ(m+n)+ε'(n) ()内の数字は添え字 というようにモデル化できると思います。 最初のm人が生活指導なし、後のn人が生活指導ありのグループでm+n=30です。 解析するには、α()は被験者間の差がないこと、ε(), ε'()は位置が異なる以外同一の分布に従いかつ独立であることという仮定が必要となります。 つまり、試験開始前の腹囲や年齢或いは性別等で、変化量やバラツキに違いがあってはいけないということです。 (例えば腹囲の大きい人の方が小さい人に比べて腹囲が下がりやすいとか、ばらつきやすいとかがあってはいけないということです) 上のモデルを書き直せば、 被験者  試験開始前  試験開始後  1     μ(1)   μ(1)+ε(1)  2     μ(2)   μ(2)+ε(2)  :  m     μ(m)   μ(m)+ε(m)  m+1    μ(m+1)  μ(m+1)+α+ε(m+1)  m+2    μ(m+2)  μ(m+2)+α+ε(m+2)  :  m+n    μ(m+n)  μ(m+n)+α+ε(m+n) となります。 ここで知りたいのはα<0かどうかなので、一人ずつ前後の差をとれば、 被験者  後-前  1    ε(1)  2    ε(2)  :  m    ε(m)  m+1   α+ε(m+1)  m+2   α+ε(m+2)  :  m+n   α+ε(m+n) となり、これについて二群の平均値(或いは代表値)の差の検定を行えばよいことになります。 検定方法は下記のサイトを参考にしてもらうとして、平均値か代表値のどちらを検定すればいいかという問題があります。 これについては、誤差εの分布が正規分布に従うか否かで決まります。 誤差が正規分布に従うなら平均値の差を、従わなければ代表値の差を検定することになります。 データ採取の前にこれらの仮定が正しいかどうかを確認する必要があります。 もちろん既にわかっているならその必要はありません。 もし、データ採取済みであった場合、追加検討できるならした方がいいでしょう。 できそうになければ、得られたデータから仮定が間違い出ないということを確認する必要があります。 二群の平均値の差の検定方法 http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html 二群の代表値の差の検定方法 http://aoki2.si.gunma-u.ac.jp/lecture/Average/U-test.html

maronaji
質問者

お礼

ありがとうございます。 正直な感想として「よく分からない」です。 丁寧に教えて頂けていることは分かるのですが…。 現在この件について集中して学習しているので、後で読み返したら 「なるほどね!」 と分かる日が来る!と信じることとします。 最初のグループ分けが多くの方を混乱させてしまうことが分かってきました。 統計学の先生に聞いた時も「?」という顔をしていました。 抽出された30名のうち、指導しなかった1年後と指導をした1年後の腹囲を比較・検討します。と言えば…。 (例えば腹囲の大きい人の方が小さい人に比べて腹囲が下がりやすいとか、ばらつきやすいとかがあってはいけないということです) おっしゃるとおりです。 今まで、経験やカンで業務をこなしてきました。自信もあります。 しかし、それを客観的に評価する手立てを身につけるため 統計について学んでいきたいと思っています。 ・・・ですが、ハードルが高いですね(笑) ありがとうございました。

関連するQ&A

  • 単回帰分析で相関が判明した後の分析について。

    統計勉強中にて、ヒントをください。  ある治療後に体腔の容積が減少します。この容積減少の経過観察しますと、初期より減少し続ける群と一旦増加後に減少する群がみられました。  そこで、初期における容積変化率をもとめますと、幾つかの連続変数と有意な比較的良好な相関がみられました。nはまだ20前後ですので、それぞれの変数での、多変量解析は無意味と考えますが、ひとまずプログレスレポートしたいのですが、    ここからの解析方法について、下記のように考えています。初期変化を増加と減少に二群に分け 1)二群間のそれぞれの変数の差の検定を行い、それぞれの変数との関係を調べる。 2)容積増加の有無とそれぞれの変数の変化の有無(規定してよいのか、どうかわかりませんが)との独立性を調べ、それぞれの変数のオッズ比を求める。 等と考えています。もしコメントをいただければありがたいです。 また、此の操作を単変量解析と解釈してよろしいでしょうか? また、初期の変化と後期変化をみますと、一旦増加した群の減少は著しい減少がみられましたので、初期増加が長期の体腔減少に関連しているのではと考えておりますが、初期の増加の有無と後期の減少の程度との関連性を調べるので宜しいでしょうか。

  • 学習における成績の統計について

    心理統計の話しなので、カテゴリー間違っているかもしれません。 ある学習における成績が、ほぼ同じ平均値となっている群があるとします。 しかし、標準偏差が全く異なり、片方はとても大きく、片方はそれほど大きくありません。 この場合、平均値だけを見て、成績はほぼ同じとしてはいけない気がするのですが、なにを計算すれば知る事ができるのか分からず困っています。 また、標準偏差が大きい方が、やや成績が悪く見えるのですが、実際悪いのか、実はこちらの方が成績が良いのか、どのようにしたら知る事が出来るのでしょうか。 変化量の事を考えたのですが、一次的な減少や増加を成績と判断するかに迷っています。他の方法があれば教えていただきたいです。 文章が分かりづらくて申し訳ないです。 アドバイスよろしくお願いします。

  • 統計の方法の選択

    特定の疾患を対象とした群間の比較を行う場合の統計方法についての質問です。 対象とされる群は、調査を行った年度ごとの特定の疾患「A」を有する患者群、とします。 n数は各年度ごとに異なります。 各群において、「A」の危険因子とされる疾患「B」を有する割合が増加しているか、減少しているか、変わらないのかを評価する場合、統計は何を用いるのが正しいのか、またどのようにデータを処理して求めれば良いのかご教示ください。 1.各年度ごとの疾患「A」を有する6つの群のn数 (大体150から300くらいです) 2.各年度ごとの「B」を有する者の数bと、そのパーセンテージ(100*b/n) (パーセンテージは50%から70%くらいです) が、わかっている条件です。 よろしくお願いします。

  • 統計 変化率の有意差検定の出し方(エクセル JMP)

    統計かなりの初心者です。教えてください。 変化率を出した2群の数値に有意差があるかエクセルで調べたいと思います。t検定で、両側分布、対のある検定で行ってみたのですが、結果は出てきませんでした。? その他、エクセルまたはJMPで有意差検定のよい方法、このような問いに対する考え方(統計全般についてまだいまいち理解できていません)がありましたら教えてください。 例:体重 A群70 B群70   3ヵ月後体重  A群68(変化率-3%) B群66(変化率-6%)   12ヵ月後体重  A群71(変化率+1%) B群59(変化率-16%) 出したいもの:3ヵ月、12ヶ月後の変化量、変化率の有意差検定 よろしくお願いします。

  • 統計処理の扱い方で困っています.

    統計処理の扱い方で困っています. ある物体を温めたり,冷やしたりなど7通りの方法にて変化した7群の面積を比較したいのです. 面積の数値を多変量分散分析にて比較したところ,どの群間にも有意差はありませんでした. しかし,もともとの何もしない状態(基準)での面積からの変化率を変数とした場合,基準とした群を含め数群間に有意差を認めました. この場合,基準とする面積の数値は「1」のみになります. このような扱い方をしてもよろしいのでしょうか? ご教授よろしくお願いします.

  • データの分析と統計処理について教えて下さい

    A群とB群の異なった2つのグループの中で、一要因に有意な差があることを検証したいのですがどのように進めていけばよろしいですか?   具体的には、A群45名とB群30名の2グループについて、 1歩行周期中における膝の屈曲-1・伸展-1・屈曲-2の連続した運動について各時間を測定し、その長さを比較しました。その結果、平均値でA群とB群を比較すると、屈曲-2において明らかな時間の差がでてきました。 そして、その傾向としてA群においては、伸展-1にかかる時間が短いと、屈曲-2は長くなるり、B群では、屈曲-2の時間は全体を通じて短い値を示しました。 A群とB群を比較して、屈曲-2の時間の長さが有意に異なることを検証したいです。 また、A群において、伸展-1の時間が短くなると屈曲-2の時間が長くなることを裏づけたい(検証したい)のですが、よろしくお願いします。

  • 統計の方法を教えてください

    お世話になります。 統計方法についての質問です。 平均と標準偏差しか分からない集団(健常群)と数名の被験者群との比較をすることは、可能でしょうか? 通常、少なくとも10名程度のdataが必要かと思うのですが、事情によりそれだけの人数を集めることができませんでした。 また、健常群についてのlow-dataを得ることが困難なため、上記の2つしか分からないという状況です。 もし、可能であれば参考URLや文献などを教えて頂ければ幸いです。 よろしくお願い致します。

  • 統計手法の選び方

    実験のデータ分析で用いる検定の手法がよく分からず,質問をさせていただきました. 統計解析についての知識に乏しく,ご指導いただければ幸いです. 人間のある関節角度の,角度変化率を時系列で見たデータを扱っています. なお,動作の開始時を0%,終了時を100%として,動作を等しい20区間に分割し,標準時間の5%ずつ,角度変化率を算出するという方法をとっています.(グラフは,横軸に標準時間をとり,縦軸に角度の変化率をとるというものになります) 被験者をA群とB群の2群に分けており,A群とB群の間で角度変化率に差がないかを検定しようとしています.(例えば,標準時間15%と20%の時点で群間に差がある,といった具合です) 2群間での比較ですので,“独立したサンプルのt検定”を用いて,それぞれの区間で一回ずつ(計20回)検定するという方法かな,と思ったのですが,確証も持てません…. 適切な検定方法がありましたら,どなたか教えていただけますでしょうか. 説明が分かりにくいようでしたら,なんなりとお申し付けください. よろしくお願いいたします.

  • 統計解析法に関して

    統計学に関しては全くの初心者です。現在、ある疾患の原因究明の研究に携わっています。具体的には、死後脳を使って候補遺伝子の発現量の違いを疾患群と健常者群とで比較検討を行います。そこで、データの解析法について御指導していただきたく存じます。論文など参考にするのですが、結果のみでそこにいきつくまでの考え方、解析の流れなどが判然といたしません。 得られた発現データと診断にてT検定を行うだけならクリアカットですが、死後脳を扱うために種々の影響を考えないといけないのではないかと思っています。実際、論文にはPMI(死後、脳摘出までの時間)、pH、死亡年齢などを考慮したように書いてあります。私の扱っているサンプルも調べてみると疾患群と健常者群でPMIなど有意な差があります。そのため、診断以外の変数が遺伝子の発現に影響している可能性を考える必要があるかと思います。素人なりに考えたのですが、それは重回帰分析をすればよろしいのでしょうか。それで発現量に影響を及ぼしている変数が見つかれば、それを共変量としてANCOVAを行う。発現量に影響を与える変数が見つからなければ、T検定もしくはOne-way ANOVAを行う。こういった考え方でよろしいでしょうか。統計ソフトはSTATISTICAを使う予定です。何卒、御指導の程よろしくお願いします。

  • ノンパラメトリックな統計解析について質問です。

    マンホイットニのU検定等で比較したい群間の標本数が大きく違う場合、有意差が出やすくなるなどの問題は生じるでしょうか? 順位和で統計量を出すと聞いて疑問に思ってます。 例えば、A群、B群の標本数がそれぞれ10と100のように大きく違う場合何か問題は生じるでしょうか? 統計の本を見てみたのですが、記号が多くて理解しがたいです。 統計を理解する気持ちは持っています。 迷える子羊にご教授よろしくお願いします。