• 締切済み

統計分析法を教えて下さい

 生徒30名の労働体験実習レポートを分析します。レポートの一文を「反省」「意欲」「学び」「感想」といった4つのカテゴリーに分けます。レポートの分量によってそのカテゴリーの文章数に個人差が差が出ます(たとえばA子は反省10、意欲5、学び1、感想7、B男は反省7、意欲7、学び2、感想8)。30人分を合計し、その第一回目と最終回のレポートで、そのカテゴリー文章数に差があるかどうかみたいです。たとえば、感想が減り、学びのコメントが増えた、など。以下のようなクロス表を作りカイ二乗検定を行えばよいでしょうか?        反省   意欲  学び  感想  合計 第一回目 200、 150、 80、 140、 570 最終回  130、 200、250、  80、 660  予想ですが、「はじめは感想ばかり書いていたが、次第に学びについての記述が増え、労働体験をするうちに多くの事を学んだ。」と言えるのではと、思っています。 統計をこれから始める初心者です。ご回答を頂ける方、どうぞ教えて下さい。よろしくお願い致します。

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.4

> 「学び」と「感想」を比較する場合は対応のないt検定で良いのでしょうか? 「学び」と「感想」についても同様です。 > 「はじめは感想ばかり書いていたが、次第に学びについての記述が増え、労働体験をするうちに多くの事を学んだ。」を示すにはどのような検定を行えばよいでしょうか? 質問文から察すると「対応のあるt検定」が適切でしょうと述べたわけですが、実際にそれが適切かどうかはデータセットをみないとわかりません(質問文から私が実際の状況を読み違えている可能性もあるのです)。少なくとも提示した「対応のあるt検定」で主張できるのは「1回目の平均値と最終回の平均値の差は有意に異なるか」ということだけです。差が認められたことをどのように考察・解釈するかは質問者さん自身です。 参考までに「独立なデータ」と「対応ありのデータ」について整理しておくとよいかもしれません。  http://homepage2.nifty.com/nandemoarchive/koten_kentei/dokuritsu_taiou.htm なお「対応ありのt検定」とはこういうもの↓  http://homepage2.nifty.com/nandemoarchive/koten_kentei/jizen_jigo.htm

fruitspie
質問者

お礼

backs様 ご回答をありがとうございました。 教えて頂きましたサイトでt検定の勉強を致します。 何度もご回答を頂きお礼申し上げます。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 レポートを数値化=データ化に疑義がありそうですが、その議論は本旨ではないと判断しますので、統計に関してだけ意見を述べます。  その前に、私の経歴を述べますと、大学で教えています。が、統計は専門ではなく、論文を書くときに必要に迫られて勉強しました。最初は、標準偏差の意味さえわかりませんでしたが、今は多変量解析でなければ、なんとかなります。多変量解析は、初心者がいきなり手を出しているのも見ますが、私は、多変量解析ではなく、初心者でもできる方法論をとっています。統計学は、わざわざ難しいして、「俺は賢い」と言いたい人が多いように感じます。近くのコンビニに行くのに、ベンツに乗って偉そうに見せている印象を受けます。私は、歩いて行けるコンビニを選びます。 30人限定、一人もデータに欠落がない、という前提で。  統計学には、記述統計学と推測統計学があり、その区別を明確にしておかないと、迷路をウロツクことになります。  例えば、Aとaを比べれば、大小があります。所持金なら、1円単位ですから同額もありますが、身長なら、mm単位まで、あるいはμm単位まで測定すれば、大小関係は誰が測ってもあります。少しでも高い方が、高い、で誰も異論の余地はありません。  A、B、C、とa、b、cと人数が増えても同じです。人数が2人以上なら、平均値や中央値などの代表値を比較すれば、誰がやっても結果は同じですから、結論は明確です。これは、事実を述べるだけなので、記述統計学、といいます。  ここで、注意することは、例え0.1でも、0.001でも違えば、「差がある」のです。『そんな小さな差は、大したことが無い』と思うのは、現実的・体験的な判断であって、統計学の論理とは別物です。  さて、A、B、Cのグループは、この三人ではなく、D、E、・・・がいるが、離れた所に住んでいる、病気で欠席した、などで、データがない。この場合は、そのデータを推測して、補う必要が生じます。その場合、結論は推測を含んだものなので、推測統計学の検定という処理をして、「有意差あり」という結論を導く必要があります。  記述統計学の結論は「差がある」、推測統計学(検定」では「有意差がある」すなわち、100回で5回あるいは1回は、ウソが混じっているかもしれない、という曖昧さを含んだと結論です。以上から理解して頂きたいのは、検定は、全てのデータを集められないので、代替手段である、ことです。パソコンなどで意味不明の計算をするので、難しい=価値が高い、というのは、世間の勘違いに過ぎません。  反省が200から130になったのは、明らかに(検定をするまでもなく)減っています。30人全員のデータなら、紛れはありません。その減ったのが、学びとなって増えた、というのは、それは、質問者の意見です。それを主張するのは、自由(=本人の勝手)ですが、賛同を得られるかは疑問、まあ白紙でしょう。意欲は増え、感想は減っていますが、カテゴリーの関係からは、どこに因果関係があるのかは、統計学で判断することはできません。繰り返しになりますが、研究者の意見です。文字数に制限が無ければ、全てが増えることも可能です。  関係を見る方法として、回帰分析があります。世間はあまり区別していないように感じますが、相関分析との相違が分かってから、手を出して下さい。私は、手を出してから、散々悩みました。結果について、3年以上悩んだこともあります。  こう書いても、レポートのデータ化に客観性=科学性の点で疑問が残ります。 釈迦に説法の点は、ご容赦を。

fruitspie
質問者

お礼

kgu-2様 丁寧なご解説をありがとうございました。 理系の頭ではないので、統計を理解するのには非常に時間がかかりそうです。 カテゴリーの分類と考察ですが、数字だけでみるのではなくアンケート結果やインタビューも行います。研究分野によっては客観性=科学性に疑問が残るというご意見も確かにありますが、修士論文もこのような分析で、統計ではなく%で比較を行いました。同じ手法で教育系の学術誌に論文が採択されたこともあります。学会発表も行っております。学問というのは、分野によって見方が全く異なりますね。 頂いたご意見は共同研究者に伝え、もう一度よく考えてみます。今まで質的に分析したものを無理やり量的に見る必要があるかということも検討します。ただ、必要最小限の統計知識を持ちたいということ、今後の自分の専門性を深めるためにも頑張ってみます。ありがとうございました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 書きこまれたデータは、カイ2乗検定、それも2群ではないので多変量解析、になります。多変量解析で主張できるのは、差があっても「全体で、有意差がある」という一点のみ。どこが増えた減ったは、質問者の感想、せいぜい意見であって、客観的=科学的には、誰も賛同しません。  次に、統計学的な問題を挙げておきます。 1 30人は、無作為抽出していないでしょうから、正規分布は想定出来ません。ですから、利用できる検定法は、限られてきます。 2 レポートを、レポートの分量によって、というのは文字数だと想いますが、生徒(高校生?)の支離滅裂な内容を、カテゴリーに分けるのは、困難を通り越しているのでは。それに分けるのは、質問者だとすると、客観性=科学性に欠けます。すなわち、データの信頼性にが無い。 3 レポートの分量が、文字数なら、知識が無いともちろん少ないのですが、多いからと言って、内容があるわけではありません。ダラダラした内容の無いレポートで、ウンザリします。  私も統計学の初心者ですが、内容から、検定は困難だと考えます。学生か院生だと想うので、指導者にご相談されるのが、科学者の倫理です。いないのなら、その旨、書きこんで下さい。  その場合、 1 30人は、どのように選ぶのか。 2 私の回答で、反省、意欲、・・・のカテゴリーに、どのように分けるのか、を返答してください。

fruitspie
質問者

補足

kgu-2様 ご回答をありがとうございました。 私は現役の教員をしております。今までは質的な分析ばかりしておりまして、今回初めて量的な分析(統計)に取り組もうとしております。 1.30名ですが、これはクラス全員の人数ですから確かに正規分布をしているとは思えません。 2.カテゴリーにつきましては、今まで質的な分析で何度か分類はしております。今までは、%で表示しておりましたが、それでは説得力がありませんので、検定を行うことにしました。カテゴリーの分類は共同研究者1名と毎回議論しながら行っています。一文を一単位と致しますが、文が長い、あるいは一文に二つの意味がある場合は統語の切れ目で2単位に分けるということを取り決めております。おっしゃるように、確かに分量が多いからといって内容があるわけではありません。ただ、救いがあるのが、生徒の文章力はそれほど低いものではなく、学力的にも比較的指導しやすいレベルです。  共同研究者も文系で、SPSSなどは使用した経験がありません。もし全く検定ができない内容であれば、この研究を断念せざるを得ませんが、なんとか形にしたいとは思っています。 ご意見をありがとうございました。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

まず > 30人分を合計し という処理の仕方が間違っています(適切ではありません)。 例えば「反省」については --- 被験者, 1回目, 最終回 A, 10, 4 B, 7, 3 --- という形でまとめます。考え方としては「1回目の平均値と最終回の平均値に差があるか」ということですから、いわゆる「対応のあるt検定」を行えばよいのです。換言すると1回目と最終回の値の差をとって、それを「独立1標本の平均値の検定」を行うのです。 意欲、学び、感想についても同様です。 例えば1回目のデータが (10, 7, 9, 11, 14) と得られており、最終回のデータが (4, 3, 4, 4, 7) とあったら、それぞれの値の差をとったものが (10-4, 7-3, 9-4, 11-4, 14-7) となり、結局は (6, 4, 5, 7, 7) というデータに対して平均値の検定を行えばよいのです。 以下、Rによる実行例の参考: > pre <- c(10, 7, 9, 11, 14) #1回目のデータ > post <- c(4, 3, 4, 4, 7) #最終回のデータ > dat <- pre - post #1回目から最終回を引いたデータ > dat [1] 6 4 5 7 7 > #差をとってそれを独立1標本の平均値の検定として実行 > t.test(dat) #t.test()はt検定を行うための関数 One Sample t-test data: dat t = 9.9469, df = 4, p-value = 0.0005737 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 4.181068 7.418932 sample estimates: mean of x 5.8 > #対応ありのt検定として実行(先ほどの方法と一致している) > t.test(pre, post, paired=TRUE) Paired t-test data: pre and post t = 9.9469, df = 4, p-value = 0.0005737 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 4.181068 7.418932 sample estimates: mean of the differences 5.8

fruitspie
質問者

お礼

bucks様 早々のご回答をありがとうございました。なるほどt検定を行うことができるのですね。よくわかりました。 もうひとつ教えて頂きたいのですが、「学び」と「感想」を比較する場合は対応のないt検定で良いのでしょうか?たとえば第1回目の「学び」の文章数平均が6、「感想」の平均が11、最終回は「学び」平均が12、「感想」平均が9になっていたとします。この場合、「学び」平均が6増加し、「感想」平均が2減少しています。「はじめは感想ばかり書いていたが、次第に学びについての記述が増え、労働体験をするうちに多くの事を学んだ。」を示すにはどのような検定を行えばよいでしょうか? 教えて頂けますと非常にありがたいです。よろしくお願い致します。 現在SPSSを発注中です。

関連するQ&A

  • Access2007 のレポートで

    Access2007 のレポートで 各会社、各支店ごとの発注数の集計表を作っています。 会社単位の合計のグループフッターの改ページをカレントセクションの後にすると、 途中のレポートは会社別の合計の後で改ページされるのですが、 最終ページにページヘッダーのみ表示されます。 この最終ページはいらないのですが、改ページの指定方法が間違っているのでしょうか?

  • google adsense

    google adsenseをはじめたばかりなのでまだよくわからない ところがあるんですけど… google adsenseのレポートをみてみると合計「ページの表示数」78回、 「クリック数」15回になっているんですが、利益のところだけUS$0.00 になってしまいます。 クリックされても報酬がでない広告などがあるんですか? よろしければおしえてください!!

  • ページ数の設定について教えてください。(WORD)

    50ページのレポートを作成してます。 その内訳として表紙が1ページ目、目次が2,3ページ目となっており、 4ページ目から文章の書き出しが始まります。 表紙と目次にはページ数を入れずに4ページ目の書き出しのところを1/(全体ページ数)とし、最終ページを(最終ページ数)/(全体ページ数)というようにしたいです。(最終ページ数と全体ページ数が同じ数になるように。) 4ページ目の数字を1ページ目からにすることはできるのですが、 最終ページが47/50とずれてしまいます。 どうすればいいですか?

  • 統計分析,解析法について

    動物行動学の研究でグループを2組(イギリス・日本)に分け前向きコホート研究を予定しています。動物の行動についてPower Pointの講義の後に動物のビデオをを見せ、見る前、後では行動の観察にどのような変化があるかを調査します。この介入(講義)がどれくらい効果があるか、2グループに違いがあるのかをテストするのが目的です。 この場合の分析法としてどの方法が適切かわからず困っています・・・。 カイ2乗検定、Mantel-Henzel検定がいいのか。暴露と非暴露グループには分けていません。このようなデータの解析に精通している方がいらっしゃいましたら適切と思われる分析法を教えていただけると助かります。よろしくお願いいたします。

  • 大学の単位について

    体育実技の授業が15有り、残りがあと2回なのですが、テストが近いので欠席をして勉強時間に当てたいと思っています。しかし、運動神経にはあまり自信がなく評価は低いと思います。出席数が足りていても単位を落とすということはあるのでしょうか。 評価方法は運動技能、関心、意欲がそれぞれ30%で、レポートが10%です。

  • ブログの上手な書き方を教えてください!

    ブログで、テレビを見た感想を書こうと思います。ちょっと書いてみたところ、 「○○したときの○○が可愛い!」「○○の○○に笑えた。」 見たいな感じで、起こった順にだらだらと思ったことを書いてるだけになってしまいました。 これじゃあ、テレビを見た人はそんなこと分かってるわけで、おもしろくありませんよね。 リピータも増えません。 テレビの感想など、同じ体験をした人が見る記事(つまり、何が起こったかなどはすでに知っている)を面白く書くコツを教えてください。 文章構成やポイントなど教えていただけるとありがたいです。 書きたいことが、たくさんあっても内容が濃くならないのであれば、 テレビなどを見て、特に印象に残った一つのことについて 濃く書いた方が、面白い記事になりますか? *検索ワード* ブログ 書き方 方法 コツ ポイント 感想 テレビ レポート 上手 面白い 記事 内容 文章構成 リピータ アクセス 注意点

  • 統計の分析について

    授業で質問紙を実施し、統計で分析をするのですが、どの分析方法で行えば良いかわからず困っています。 私がやろうとしていることは、まず、状態不安尺度を実施⇒不安が喚起されるような出来事・安心感が喚起するような出来事を実験により与える⇒再度、状態不安尺度を実施し、不安喚起条件群と安心喚起条件群それぞれの状態不安がどう変化するかをみたいと思っています。 この疑問は、すでに回答者様からとても詳しい回答を頂いており、解決しております。 (出来事(不安・安心)×状態不安尺度測定時期(前・後)の2要因2水準の分散分析を行う予定です。) 次に、不安喚起・安心喚起によって状態不安が変動する人・しない人(不安喚起によって安心したり、安心喚起によって不安になったりしないものとするので、不安喚起によって状態不安が高くなる人(変動する)と、変動しない人の2群のみを考えています)の個人特定をみるために、モーズレイ人格目録(MPI)という質問紙も実施したいのですが(一回目の状態不安を測る時に、一緒にMPIも実施します)、この場合は、どういった分析方法で分析すれば良いでしょうか? 私としては、MPIの9分類と、被験者を変動した群・変動しない群の2群にわけた、両群によるMPIの差をt検定にて検討、という分析方法を考えています…が、まだ統計を習いたてなので、これで正しいか分かりません…。この分析方法は間違っているでしょうか? まだ、統計は習ったばかりなので(先生曰く、まずアンケートやって分析してみなさいとのことなのです)わからないことばかりです。 ですが、アンケートをとってからあわてるのはいやなので、まず質問紙を取る前に、取り終わった後にどのように分析するか、きちんと決めてから調査を行いたいと思っています。 すでに書きましたが、私は統計がかなり苦手なので、わかりやすく回答していただけたらと思います。 よろしくお願いします。

  • 統計の分析について、教えてください。

    現在、大学(心理学専攻)の課題をやっているのですが、 分析にどの手法を使えばよいのかがわかりません。 重回帰分析、分散分析、t検定の、それぞれの特徴、 どういった場合に用いればよいのかを教えてください。 よろしくお願いいたします。

  • 統計分析^^

    統計分析の質問です. 私は今,気象予測の研究を行なっており,過去十七年間の気温,気圧,風向など7つの項目データがあります.それらの項目から関係性の高いものを取り出して,関係性を見ながら気象予測をおこないたいのですが,統計分析としてどのように関係性のある項目を取り出す方法がありますか?

  • 統計分析について

    統計分析についてある分析の結果で3σで±4μmだたと言われれば、 どうやって解釈するのができますか? 自分で検索したら、下の通りような記事を探ったんですが、 ±σ(σ区間):68.3% ±2σ(2σ区間):95.4% ±3σ(3σ区間):99.7% ±6σ(6σ区間):99.9997% 3σで±4μmだったら、 分析データでサンプルの全体で99.7%が±4μmの中にあることと 理解すればいいのかどうか知らないですが、 例えば6σで±4μmだったら全体中に99.9997%が±4μmの範囲に あることと解釈ができますか? 統計分析に関して、いくら見ても理解が難しかったんですが、 分かりやすく教えていただけませんか? ぜひお願いいたします。