統計の基礎問題についての質問とは?

このQ&Aのポイント
  • 統計の基礎問題について質問があります。
  • 大学の文学部と理学部の学生への調査結果からデータを解析し、意見間の関係を検証する必要があります。
  • データによって連関性が異なることが判明しましたが、その解釈についての質問です。
回答を見る
  • ベストアンサー

統計の基礎の問題についての質問です。

統計の基礎の問題についての質問です。 ある大学の文学部と理学部の学生各100人に対し「前期末試験は夏休み前に実施した方がよい」(以下意見(1)という)および「学園祭の期間はもう1日長くした方がよい」(以下意見(2)という)というふたつの意見の賛否を問う調査を実施した。その結果、意見(1)と意見(2)との間に、文学部については弱い負の連関性が、理学部については正の連関性が認められたが、このことを示すデータは次のうちどれか。 データA           意見(2)賛成 意見(2)反対   計 意見(1)賛成      42      13     55 意見(1)反対      28      17     45  計           70      30     100 データB           意見(2)賛成 意見(2)反対   計 意見(1)賛成      28      22     50 意見(1)反対      32      18     50  計           60      40     100 データC           意見(2)賛成 意見(2)反対   計 意見(1)賛成      35      18     53 意見(1)反対      30      17     47  計           65      35     100 答えが、文学部のデータはBで理学部のデータがCとなっていて、私の答えはどうしても理学部の答えがデータAとなってしまいます。 答えの解説には、意見(1)と(2)の間に正の連関があるというのは、意見(1)で賛成の人が意見(2)でも賛成と答える割合が高く、意見(1)で反対だった人は意見(2)でも反対ということである、とあるのですが、その人数の割合を計算したときにAのデータの方が高い割合がでてしまいます。 統計は基礎レベルでしか習ってないので基礎の質問とは思うのですがご回答の方お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

このデータから、以下のように分析できます。 「意見(1)に賛成なら、意見(2)にも賛成と言えるか」  この解析で、データAをA群、BをB群、CをC群として、話を勧めます。A、B、Cはどこかの学部ということになります。  A群は、意見(1)の賛成は55%、(2)については70ぇ B群は、(1)は50%、(2)は60% C群は、(1)は53%、(2)は65%になります。 これを散布図で描くと、より明確ですが、 (1)の意見に賛成%が高いほど、(2)の意見にも賛成が高くなる、傾向が見えます。 見えますとしたのは、散布図上で、3点しかありませんので、統計学的には証明できません。最低でも5点、すなわち、5群は必要でしょう。  結論として、「(1)が賛成の群は、(2)も高くなる」かも(データ不足)。  したがって、弱い負の関連と言うのが、(1)より(2)の賛成率が低い、というのなら、正解は無し。  統計では、個人で見るのではなく、集団として考えるので、問題の解説は、意味が不明です。問題では、学部、解説では人、とするなら、支離滅裂。  また、(1)と(2)は、どう考えても理由が分かりません。ですから、連関と言っても、見かけ、そう見えるだけでしょう。ですから、練習問題と言われればそれまでですが、初心者を統計の道を踏み外すようなものを・・・、と感じます。

abbeyr
質問者

お礼

ご回答の方ありがとうございます。詳しい解説の方もありがとうございました。

その他の回答 (1)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

 久しぶりに統計学としてヒドイ問題をみましたので、横から口をだします。初心者を惑わすことになります。初心者の私も・・・。 これは、関連が認められたという表現があるので、検定に属する問題だと考えます。  検定の場合、結論として主張できるのは、「有意差あり」ということだけ。関連があるとか、強いとかの判断は、検定をしてもできません。統計学の教科書のどこを見ても、連関性なんぞのいい加減な表記はナイハズです。  連関性はともかく、強弱、正負で浮かぶのは相関分析です。相関分析では、相関(問題では連関性とイイカゲンナ表現ですが)、正負の相関、その強弱を判定できます。しかし、このようなデータでは不十分で、不可能です。  正当な問題は、「意見(1)について、賛成の群と反対の群では、意見(2)について、賛否に差はあるか」です。これは、カイ2乗検定をすることによって、有意差の有無を判断できます。  この場合でも、A、B、Cの比較をするのは誤りです。なぜなら、統計学的有意差の有無は言えますが、実際の差異について、大小を言うのは誤りです。  数学の問題、というのなら、別でしょう。

abbeyr
質問者

お礼

ご回答の方ありがとうございます。詳しい解説の方もありがとうございました。

abbeyr
質問者

補足

ご回答の方ありがとうございます。 この問題は、社会学の中の統計の問題のセクションにあったので回答者さんのおっしゃる通り、統計よりは数学的に答えを出してほしいのかもしれません。 解答には、意見(1)と(2)の間に正の連関があるというのは、意見(1)で賛成の人が意見(2)でも賛成と答える割合が高く、意見(1)で反対だった人は意見(2)でも反対ということである3つのデータにおける賛成意見と反対意見をそれぞれパーセント計算したときに、いちばん正の連関性が強く認められるのはCであるから、理学部はCのデータが妥当である。 とあるのでデータAの42と17をそれぞれパーセント計算して、他のデータに比べて割合が高かったのでデータAが理学部のデータだと思ったのですが解答はデータCとなっています。どうしても私の答えと解答が一致しません。 数学の問題としてで結構ですので、ぜひご回答のほうお願いたします。

関連するQ&A

  • 基礎統計 問題

    授業で基礎統計を選択受講しているのですが、先生から次のような問題が出されました。 ある事象A1、A2、A3がおこる確率がそれぞれ、P(A1)=0.2、P(A2)=0.3、P(A3)=0.5であったとする。また事象A1、A2、A3が発生したときに、事象Bが起こる確率をP(B|A1)=0.3、P(B|A2)=0.9、P(B|A3)=0.7とする。このとき、事象Bが起こる時の事象A1,A2,A3が起こる確率を求めなさい。 P(A1|B)=        、P(A2|B)        、P(A3|B)= 以上です。 公式を教えてもらったのには、 P(Ak|B)=P(Ak)P(B|Ak)|P(B) であり、ただ公式に当てはめればいいとの事みたいなのですが、よくわかりません。 答えを教えて下さいまでは言いませんが、Bの出し方を教えて頂きたいのですが、 心優しい方ぜひ宜しくお願いします。

  • 統計に関する疑問

    統計検定の問題なのですが、(以下問題) あるアンケート調査で,いくつかの質問をした。問1は次の形式である。 あなたは「XXX」の意見に賛成ですか,それとも反対ですか?次の1から5のうち, あてはまるもの一つを選んでその数字を○で囲んでください。 1. 賛成  2.やや賛成  3.どちらでもない  4. やや反対  5. 反対 問2は「YYY」の意見についての同様な 5 肢選択の質問である。 回答について、○で囲まれた数字コードを数値として記録した。問1について集 計した結果は,平均が 2.6,標準偏差が 0.84,問2との相関係数は 0.46 であった。と ころが,問1の質問の趣旨を踏まえれば,選択肢の数字コードを逆向きにした方が よいのではとの意見が出されたので, 「賛成」を 5,「やや賛成」を 4,「どちらでもない」を 3,「やや反対」を 2,「反対」を 1 に振り直した。この数値コードを新コードと呼ぶ。新コードに基づいた平均,標準 偏差,相関係数がどうなるかについて,次の記述 I~III がある。 I. 平均は変らない。 II. 標準偏差は変らない。 III. 相関係数は変らない。 これらの記述の正誤の組合せとして,適切なものを次の 1 ~ 5 のうちから一つ 選べ。 答えは「II のみが正しい。」 になるのですが、なぜでしょう。 平均が変われば、各変数から平均を引いて、算出する分散の値も変われば、標準偏差も変わると思うのですが。統計を勉強し始めたばかりで、わからないことばかりです。 詳しく解説していただけるとありがたいです。 出典:統計検定2級 問題より http://www.toukei-kentei.jp/about/pastpaper/2012/grade2.pdf

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • このサイトの質問について

    このサイトでは意見を聞く質問が投稿される場合がありますよね。 例えば「○○についてどう思いますか?」や「○○について賛成ですか反対ですか?」もしくは 「○○はいると思いますか?(信じますか?)」という質問があります。 「○○について賛成ですか反対ですか?」や「○○はいると思いますか?」という 質問はあまり意味がないのではないでしょうか? 意味がないと思う理由は下記のとおりです。 「○○についてどう思いますか?」やはこのサイトには色々な方がいるため色々な意見が聞けて良いと思う。 しかし「○○について賛成ですか反対ですか?」や「○○はいると思いますか?(信じますか?)」の答えは 「賛成と反対」もしくは 「いるといない(信じる・信じない)」の2つだけである。 そのため多い方の意見を持つ人の回答が圧倒的に多くなってしまう。 例えば反対意見または「いない(信じない)」という意見が 多いことについて質問すると当然、反対意見もしくは「いない(信じない)」という意見が大量に投稿される。 質問に投稿するのはごく一部に人であり賛成意見を持つ人 がいても投稿しないことがある。 反対意見・「いない(信じない)」という意見が大量に投稿されている質問に賛成意見や「いる(信じる)」という 意見を投稿するには非常に勇気がいるため、投稿しにくい。そのため場合によっては1件も賛成意見や 「いる(信じる)」という意見が投稿されないかも知れない。 こういった理由で私は意味がないと考えております。 私は以前に「小・中学校の新しい学習指導について賛成ですか?それとも反対ですか?」という質問をしたことが あるります。 私は賛成・反対の両方の意見を聞きたかったのですが反対意見が大量に投稿され賛成意見を1件も投稿されませんでした。 ご意見をお聞かせ下さい。

  • データ間に差がないことを統計的に述べるには?

    データ間に差がないことを統計的に述べたい場合,どのような検定手法を実施すればよいのか? ということで,悩んでいます. 例としまして,以下のような条件で実験を行い,実験の結果を統計的にみて差がない(差がみられない?)と述べたい場合,3要因の分散分析を実施すればよいのでしょうか?御教示・御助言よろしくお願いします. 例) 2つの異なる六面サイコロ(サイコロA,サイコロB)を,朝昼晩に600回ずつ振り,サイコロの目を記録した. この結果をもとに,何らかの統計手法を実施し,サイコロAとサイコロBに差がないことを述べたい. 私の予想では3要因の分散分析を行い,有意差が見られなければ,2つのサイコロに差がない(差がみられない?)といえる,と予想しているのですが誤っていますでしょうか?

  • 統計学、どの検定を使うべきか

    統計の授業をアメリカでとっているのですが、よくわからない問題があったので質問させて下さい。 とあるデータを取扱う事になり、そこでどの検定を使えば良いか、あるいはどのように考えて答えを導きだせば良いのか困っております。 エクセルに A列にyes=1 no=2という感じで数字が並んでいます。 B列にはその人の年収が入っているとして 1 100 1 150 2 200 1 300 こんな感じです。。 給与が高い人が1(yss)と答えている確率が給与が低い人より多いかどうかを調べる場合、 どのように統計学を応用して答えを導き出せが良いのでしょうか。 給与については、ここからが低い、ここからが高いという基準はありません。

  • 【統計】2つデータが似ているか調べたいのですが

    私の手元に1グループ10人の構成員がいる2つのクラスA、Bに、各々同じ試験を行った得点データがあります。私の現場の感覚としてはAクラスとBクラスの実力は同じくらいだろうと感じていますが、それを統計の手法で数学的に示してみたいと思っています。Excelは持っているので使えます。 ちなみに、私の統計の基礎知識としては昔F分布、t分布など習ったが計算ばかりでどういうときに使ってどんな結果から何が言えるかなどは理解できていないレベルです。 お力添えいただきたく存じます。

  • 統計学の検定のもんだいです。

    前回分 すいません、タイプミスがございました、ご容赦をおねがいします。 検定の問題です。答えも知りたいですけど 自身の考え方が正解かどうか 知りたいです。ご指導宜しくお願いします。 健常者のIgG値の平均値は1180(mg/100ml)であることが知られているとする。A病院における透析患者のIgG値(mg/100ml)の平均値は健常者の平均値と異なっていると言えるか、[A]のデータを用いて有意水準0.05で検定せよ A:1326 1418 1820 1516 1635 1720 1580 1452 1600 (1)帰無仮説と対立仮説を記すこと。 (2)有意水準0.05として、この検定の棄却域を求める(両側検定を行う)。 (1)棄却域を求めるためのRのコマンドを記すこと。 (2)求められた棄却域を T>a, T<b という形で記すこと。ここで、a,bは具体的な値。 (3)検定のための統計量の値を求めるRのコマンドを記すこと。 (4)統計量の値を記すこと。 (5)棄却域と比較することにより帰無仮説を棄却するか採択するか決め、結果を記すこと。 (6)最初に与えられた質問(最初の文章)に解答せよ。 (7)p値を求めるRのコマンドと結果の値を記すこと。 (8)p値の結果の値から帰無仮説を棄却するか採択するか決め、結果を記すこと。

  • 集合の問題

    公務員試験の問題なんですが、導き方が理解できないので教えてください。 問題:ある会社の会議で、A案、B案、C案の3つの案を検討した。次のことがわかっている時、すべての案に反対した人は何人か?  ア 会議に参加したのは128人  イ A案に賛成したのは70人  ウ B案に反対したのは55人  エ C案に賛成したのは65人  オ 3つの案に賛成したのは36人  カ 2つの案に賛成したのは45人 答:37人  解説ではB案に賛成した人を128-53=73と置き換えられているのですが、わかりません。お願いします。

  • 統計学の課題が出ました。問題は解いたんですけど、自信ないので助けて欲し

    統計学の課題が出ました。問題は解いたんですけど、自信ないので助けて欲しいです。 50羽ずつの鶏からなるA・Bグループに対して実施した結果、 体重増に関する以下のデータを得た。Aを新飼料グループBを標準飼料グループとする。 XAが277.4グラムXBが255.6グラム SAが83.4グラム SBが72.2グラム (1) 新しい飼料と従来の飼料との、体重増に関する飼育効果に関し、いかなる結論が引き出されるか? 有意水準0.05のもと、片側検定により、検定せよ。 (2)新飼料での平均体重増について、95%信頼区間を求めよ。多分正規分布を用いると僕は思います。 (3)先ほどのデータが20羽ずつの鶏からなる(1)と(2)を求めよ。多分t分布を用いると僕は思います。 出来れば解説付きで答えて頂きたいです。