• 締切済み
  • 困ってます

統計学上の有効数字の取扱について

統計学での有効数字について以下のように考えています。これでよろしいでしょうか、教えてください。 1.データが標本抽出からで、誤差を含んだ上での計算をしているので細かく考える必要はない。 2.誤差は他のばらつきと共に、分散に入っているので、細かく考える必要はない。 3.検定表(z分布表など)と比較するので、検定表に記されている5桁程度を用いる。

共感・応援の気持ちを伝えよう!

みんなの回答

  • 回答No.2

統計を取る対象が測定値ではないなら、有効数字なんてないですよ。 サイコロを10回振って出た目の合計の分布とか、試験の点数分布とかだと、 そもそも誤差を含みませんから。 また、身長とか体重とかでも有効数字は分布の幅じゃなく、測定値そのものが有効数字を決めます。 たとえば、小学6年生の身長とかだと当然のごとく10cmの単位でばらついているはずですが、 このばらつきは誤差ではなく、実際に広がっている身長の分布を示しているので、 この分布の幅から有効数字を決めるなんてことは絶対にやってはダメです。 対してA君という同一人物の身長を10回測ってその測定値の分布を出すという場合には、 その分布の拡がりが有効数字を決めます。 要は対象しだいなので機械的にやってはダメです。

共感・感謝の気持ちを伝えよう!

  • 回答No.1
  • alice_44
  • ベストアンサー率44% (2109/4758)

1.抽出による誤差の程度は、母分布を推定すれば、見積もることができる。   データの誤差が標本抽出による誤差に比べ無視できる大きさかどうかは、   検討を要する問題である。   データの誤差のほうが大きければ、統計学的分析には意味が無くなる。 2.分散だけでバラツキを評価することはできない。   単峰対称な分布だけ考えても、高次モーメントを考慮することが必要な場合もある。 3.最終的に表と比べるなら、検定表より高精度の計算をしても意味は無いが、   計算した値が表と同程度の精度を持っているのかどうかは自分で考える必要がある。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございました。

関連するQ&A

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 統計学の有意水準について教えてください!

    統計で検定を学んでいるのですが、有意水準が0.05のとき、比率の検定ならば、Z(0.05)=1.64 となっています。 公式で、棄却域に検定統計量Tが含まれる確率が α/2 になるところまではわかるのですが、 問題になり、実際に値をもとめるところになるとまったくわかりません。。。 この、1.64 という数字がどこからきたのか、 どうやって求めるのか、教えてください>< 正規分布表やT分布表は関係あるのですか??

  • 層化比例無作為抽出時の検定などの方法

    とある書籍にて以下のことを学習しました。 ・層化比例無作為抽出法を用いて標本抽出をおこなった場合、標準誤差の算出には標本全体の分散ではなく、各層内分散の加重平均値を用いる。 ・よって、単純無作為抽出時に比較して標本誤差を低く抑えることができる(ことが多い)。 ここで質問なのですが・・・、 ・層化比例無作為抽出をおこなう場合、すべてのな区間推定や検定,果ては分析仮定で標準誤差を用いるすべての多変量解析において、一般的な統計ソフトを用いることは『正しくない』のでしょうか(大抵の統計ソフトは単純無作為抽出を仮定していると考えています)? ・『正しくない』とすれば、皆さんはどのように対処されてらっさるのでしょうか?ご自身でスクリプトを書いたりされているのでしょうか?それとも、「分析結果にさほど影響を与えるものでもないから統計ソフトで済ましている」といった感じなのでしょうか? 以上、どなたかおわかりの方がいらっしゃいましたら、ご教授いただけませんでしょうか? 宜しくお願いいたします。

  • 統計に関する質問です。

    統計に関する質問です。 小麦における3産地以上の蛋白質含量における差を比較しています。 それぞれ標本数の異なり、例えばアメリカ産は1000標本、カナダ産は500標本、国産は50標本となっています。 その場合は、分散分析し、差が見られた場合はturkey法という多重検定で精査する統計法が適しているのでしょうか? ご助言をよろしくお願いします。

  • 統計学の問題です。数学が大の苦手で大変申し訳ないのですが解けないので…どのようにとけば良いのかお願いします。

    統計学の問題です。数学が大の苦手で大変申し訳ないのですが解けないので…どのようにとけば良いのかお願いします。 以下が問題です。 【1】Z~N(0、1^2)、X~Z(40、8^2)のとき以下を求めよ。 1)Pr(0.82<Z<1.43)= 2)Pr(0.82<Z<a)=0.124となるa= 3)Pr(40<X<54)= 4)Pr(40<X<b)=0.324となるb= 【2】正規母集団と考えることができる母集団から15の標本を抽出したとき、標本平均x=32.4、標本分散s^2=4.8であった。 1)母分散σ^2=4.2であると考えてよいとき、母平均μの95%信頼区間を計算せよ。 2)母分散未知のとき、母平均μの99%信頼区間を計算せよ。 3)母分散σ^2の95%信頼区間を計算せよ。 【3】正規母集団と考えることができる母集団から16の標本を抽出したとき、標本平均x=181.7、標本分散s^2=9.8であった。 1)母平均μが179と異なるかどうかについて有意水準α=0.05として、両側検定を実施せよ。 2)母分散σ^2が8より大きいかについて有意水準α=0.05として、片側検定を実施せよ。 【4】ある試験の受験者の合格と不合格のA,Bのそれぞれの人数を下に示す、クラスにより合否に違いがあるかどうか、有意水準α=0.05 として片側検定を実施せよ。 合格 不合格 A 72 17 B 53 33 以上です。大変申し訳ありませんがよろしくお願いします。

  • 【統計学基礎】自由度とは?

    【統計学基礎】自由度とは? 以下の問題で自由度について答えさせられるのですが自由度とはなんでしょうか?自分はただ自由度=標本の大きさ-パラメータと考えていたのですが色々パラメータがどれを指すかによってかわってきて混乱してきています。 平均u=5、分散σ^2=4 の正規母集団より大きさn=16の無作為標本を抽出する。このときy=(n-1)s^2/σ^2は以下省略…また‐xを標準化したZは正規標準分布にしたがい、‐Xとs^2は統計的に有意であることから、z/√y/15は自由度???のt分布に従う。 という問題です。まずそもそもz/√y/15の式の意味もよくわからないのですがご回答お願いします。

  • ノンパラメトリックな分散分析(統計)

    ノンパラメトリック検定であるU-検定(Mann-Whitney検定)は等分散でないと行えないとの記述がありました。 そこで2標本が等分散であるかどうかを確認したいのですが、何が適しているでしょうか? 正規分布を示していないことは確認済みです。 当初、F-検定で分散を確認しようかと思っていたのですが、F-検定は正規分布が前提であるということで、利用できないと気付きました。 Kruskal-Wallisの順位検定法が良いかとも思ったのですが、手持ちの統計ソフトでは、3標本以上でないと計算してくれません。。。 中央値検定(Median検定)がF-検定のノンパラメトリック版なのでしょうか?? 詳しい方教えて下さい。

  • 統計学の標本についてです

    下記の問いが分からずに困っています。 手計算でも良いですが、可能ならばExcelでの求め方も教えて頂けると幸いです。 1.平均100、分散1000の正規分布に従う母集団から10個の無作為標本を抽出する。 (1)標本平均の分布は? (2)標本平均値が110を越える確立はいくつか? 2.母比率が0.3である場合、その母集団からの100個の無作為標本に基づく標本比率が0.4を上回る確立はどの程度か? (1)標本比率の分布は? (2)その分布で0.4以上の値を得る確立は? よろしくお願いいたしします。

  • 【統計学】標本抽出の際の初歩的な質問

    今月から統計学をまずは予習し始め、「はじめての統計学」と言う本にお世話になりながら一人で勉強しております。 標本から、乱数表を利用して抽出をする練習問題をしておりますが、標本の合計数が例えば40に対して、乱数表では64とか98とかの数が抽出された場合は、40までの標本なので数が存在しません。 その場合は、どのように扱えばよろしいのでしょうか? 観測データ表には標本が存在しない乱数表で指定された数の箇所は、空欄などにすれば良いのでしょうか? その逆もしかりで、200位ある標本なのに、乱数表は2桁で抽出した場合は、最大99までの乱数の抽出となってしまい、間違ってしまっているような気がいたします。しかし、3桁で乱数を抽出すると679などが抽出されると、標本は無い訳で。。。。 う~ん、トートロジーに陥っているような。。。 誰かお力をお貸しください。