• ベストアンサー

基本的な質問ですが

stomachmanの回答

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.11

補足見ました。もう一度、本質的な点だけに絞って整理します。  例えば、母集団として、M=10個のデータがあるとします。 (「わたしの今年のボーリングのスコア全部」というのでも良いですね。)  計算が面倒だから、母集団からN=5個のサンプルをとって、これを使って「母集団の平均値と標準偏差を推定しよう」とする場合を考えます。  データを無作為に選んで作ったN=5個のサンプルは、偶然のために、多少大きい目か、小さい目の方に偏ってしまいます。だから、サンプルから計算した平均値は、「母集団の本当の平均値」に比べて、多少大きい目か、小さい目の方にずれてしまいます。  しかしこの計算で出た平均値を「母集団の平均値の推定値」として使わざるを得ません。サンプルが大きい目の方に偏っているか、小さい目の方に偏っているかは分からないからです。  次に、この同じ5個のサンプルを使って、母集団の標準偏差を推定します。この場合、計算に使う平均値がそもそも「母集団の本当の平均値」に比べてずれている。この「偶然のずれ」の影響が最低限になるように補正するのが、標準偏差の計算式の分母にあるN-1 の「-1」の部分なのです。(どうして-1を付けると良いのか、というのが前の回答で数式で示した内容ですが、あんまり気にしないで。) 「自由度」という言葉については、以下のように考えると良いです。 ●「なんでも良いから5個数値を書きなさい。」と言われれば、5個の数値を好きなように選べます。これが自由度5。 ●「なんでも良いから5個数値を書きなさい。ただし、その平均値が100になるようにしなさい」と言われれば、4個の数値a,b,c,dは好きに選んで良いのですが、5個目のeは、「平均値が100になる」という条件から、自動的に決まってしまいます。  だから、自由に選べるのは4個。つまり自由度4。 ●「なんでも良いから5個数値を書きなさい。ただし、その平均値が100、標準偏差が10になるようにしなさい、」と言われれば、3個の数値a,b,cは好きに選んで良いのですが、4個目のdと5個目のeは、「平均値が100、標準偏差が10になる」という条件から、自動的に決まってしまいます。  だから、自由に選べるのは3個。つまり自由度3。  なお、前の回答の数式は、Σを使っているのが難しさの理由かも知れません。どうしても必要なら、N=4ぐらいにして(つまりΣx[j] の代わりにx[1]+x[2]+x[3]+x[4]に書き換えて)追っていってはどうでしょうか。

rickbon
質問者

お礼

なるほど!理解できましたあ! ありがとうございます。 当初私、「標準偏差」が統計学の分野であることも知らずにおりましたが、おかげで少しはお利口になりました。 何がわからないかがわからない状態でしたので、どこに行くか分からない補足質問をしましてすいません。 そんな私に丁寧に回答して頂いた他のみなさん、kawakawa様、MiJun様、mako18様、nanashisan様にもこの場を借りてお礼申し上げます。 ただ、少し賢くはなりましたが、その分この質問に関連してまだまだ分からないこと知りたいことがたくさんあることに気付きました。 そこでこの質問を一旦締め切り、年が明けたら今度はもう少し具体的に問題を絞り込んで別の質問を立てたいと思いますので、その時はまた来たかとよろしくお願い致します。 それではよいお年を!

関連するQ&A

  • 標準偏差の算出について質問があります。

     野口悠紀雄著『金融工学、こんなに面白い』(文春新書)中の標準偏差の算出で質問があります。    74頁 表3-4に、     円安   円高  標準偏差 A社  1000円  300円  494.97円 とあります。  数学の教科書にあります方法で標準偏差を求めますと、A社の株価の平均は650円ですから、 {(1000-650)×(1000-650)+(300-650)×(300-650)}÷2の平方根で350円になります。エクセルの関数STDEVPで計算しても350ですし、同書79頁の表3-5(III)でも標準偏差は350になっています。  ところがエクセルの関数STDEVで計算しますと、確かに494.97になりますので、著者の間違いとは思えません。  そこでお尋ねします。 (1)上の例で、494.97になる標準偏差と350になる標準偏差は、金融工学的にどういう場合で使い分けるのでしょうか?(エクセルの説明では、前者STDEVは「標本に基づいて予測した標準偏差を返します。」、後者STDEVPは「母集団全体に基づく、ある母集団の標準偏差を返します。」とあります。正直申して、全く意味が分かりません。) (2)494.97になる標準偏差(エクセルの関数ですとSTDEV)の計算方法を教えてください。  数学にも、金融工学にも素人です。なにとぞよろしくお願いいたします。

  • ボリンジャーバンドの標準偏差の計算方法。

    ボリンジャーバンドの計算方法で良くわからない所があるので教えて頂きたいと思います。計算方法はn日移動平均線を基準とする場合、まずn日の標準偏差を求めます。n日の標準偏差は、n日間の個々の終値からn日移動平均値を引き、それぞれを2乗し、「その数値n日分を合計したものでnを割り」さらに平方根したものがn日標準偏差になります。これにより求められたσ(標準偏差)を、当日移動平均値から加減したものが±1標準偏差です。±2標準偏差を求める場合はσを2倍したものを加減します。という事なのですが「その数値n日分を合計したものでnを割り」という所は、その数値n日分を合計したもの「を」で割るではないのでしょうか?20日目の標準偏差値を求めるため具体的に数字を当てはめてみたいと思います。nは20日、20日目の終値は21,090、移動平均値は19,378、とします。よって21,090-19,378=1713X1713=2,932,656となります。この値のn日分の合計を24,909,236とすると、テキストによる計算では20÷24,909,236=0.000000802915 となり、これを平方根した0.00089606が20日標準偏差となると思います。しかしこれでは値が小さすぎて明らかに間違いだと思います。逆に24,909,236÷20=1,245,462、これを平方根で返してやると1,116となり+2標準偏差は21,610になると思います。でもこの値でも正解と微妙に違うんです。標準偏差の正しい計算方法と、今回示した例の+2標準偏差の値を教えて下さい。宜しくお願い致します。

  • 工程能力のN数補正について

    データ数(N数)が少ない場合の工程能力を求める際、標準偏差を補正したいです。調べたところ下記2つの方法があるようなのですが、どちらが正しい考え方なのでしょうか。使い分け等あれば教えていただきたいです。補正方法(1)のほうが(2)に比べて補正係数が大きく(信頼区間にもよりますが)、その意味するところの違いも教えていただきたいです。 できれば、実用面からエクセルでの計算例もあるとありがたいです。 ※下名の知識レベルとしては、学生時代に一度統計学の講義を受けた程度でほとんど忘れています。 補正方法(1)(・・・計算方法はわかりました)  標本から求めた標準偏差をχ二乗分布で区間推定し、  母集団の標準偏差とのずれを補正する   ※参考URL:http://ouenblog.divaandco.com/?eid=940571 補正方法(2)(・・・合っているかだけでなく、計算方法も不明)  標準偏差の不偏推定量D(Wikipediaより)を直接使い、標本の標準偏差との差を補正する。  具体的には、不偏分散u^2にはエクセルにおけるSTDEV関数で求めた標準偏差を代入し、  ガンマ関数の部分はGAMMALN関数内に自由度÷2、データ数÷2を入れて計算する?   ※参考URL:http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE   →"統計値の標準偏差"の上から5番目の式 統計学は難しいですね・・・ ご回答よろしくお願いします。

  • 標準偏差及び3次、4次の中心積率の数字の意味につ…

    標準偏差及び3次、4次の中心積率の数字の意味について タイトルに書かせていただいた標準偏差等は計算できるのですが、導き出された数値の解釈が今一わかりません。よろしくお願いします。

    • 締切済み
    • ISO
  • 標準得点はなぜ平均0,分散1になるのか

    標準得点がなぜX~N(0,1)の分布になるのかが理解できません。 なんとなくですが、計算式 "(X-平均)/標準偏差"から、標準得点とは 「"平均から値Xの差"が標準偏差のどれくらいの割合か」 という意味だろうなぁと理解してます。 しかし、なぜこの計算式の結果が、平均が0、標準偏差が1の分布になるのでしょうか?

  • 標準偏差と平均偏差の違い

    標準偏差と平均偏差は、数字としての意味は何が違うのでしょうか。(算出方法の違いなどは分かります) 換言すれば、平均偏差でもサンプルのばらつきが表現できるのに、わざわざ計算過程をややこしくして標準偏差を求めることにどのようなメリットがあるのかということです。 『数種類の検体を用いて同一行程の実験を行い、その結果の値の揺れ(ばらつき)を求めたい』 このレポートへのアプローチとして、平均偏差または標準偏差を利用するとき、両者が意味的にどのような違いをもつのか、ご教授ください。

  • 株式のリターンってどうやって求めるの?

    一般的に株式のリターンが5%とか書いてある時、それって どういうふうに計算されているんでしょう? もちろん購入時1000円が売却時に1500円ならリターンは500円 で50%だってことはわかってるんですが、買い時はいっぱいあるし 売り時もいっぱいあるし、いったいどのデータを用いてリターンを 計算しているんでしょうか?さらに一般的にリターンってどのくらい の期間で得られるリターンのことを意味しているんでしょう?まぁ 1年間のリターンだとは思うんですが。。。 ご存知の方いたら教えて下さい!! 加えてできれば標準偏差の求め方もお願いします! これについてももちろん標準偏差の計算方法はわかってます。 いくつかリターンがあってその平均を求めてその平均値から 平均的にどのくらい乖離するかを計算するんですよね。 ただこれについてもリターンいくつあるんですか?無限? もしかして微分とか使わないと標準偏差求めれなかったり するんでしょうか? 株式に限らずリターンとか標準偏差の定義がよくわかりません。。。 すみませんが誰かご教示下さい!!

  • 標本標準偏差の発生確率を計算したい

    母標準偏差=7.0の母集団から、サンプルを6個取り出したときに 標本標準偏差<6.0となる確率を計算したいと考えています。 エクセルで計算する方法を教えてください。

  • エクセルの関数について教えてください。

    標準偏差を求めるのですが その表が4月から翌年3月になっていて ひと月のデータ数は最大で50くらいですが決まっていません。 空白の場所には 計算式が入っていて、データが入力されていないと 「0」が表示されています。 この「0」は標準偏差を計算するときも計算されてしまのですが 「0」は計算しないで標準偏差をだしたのですが 方法を教えてください。 宜しくお願い致します。

  • 発芽試験の根長測定の計算の仕方を教えて下さい

    発芽試験における、根長測定の計算の仕方を教えてください 発芽試験のGI(発芽指数)を求める計算の中で、誤差をどれくらい考えればよいのかわかりません。。。 約120個のコマツナの根の長さを測りました。 先生に教えてもらった方法だと 120個を30個、30個、30個、30個の4つのグループに分けて、それぞれ平均を出す。 (1)33.098875 (2)37.9744 (3)36.7502381 (4)40.05420833 (単位はmm) (1)~(4)の平均と標準偏差を出す。 36.96943036(平均) 2.918622002(標準偏差) また別の先生に教えてもらった方法だと 120個をすべて一気に平均と標準偏差を出す。 36.98711702(平均) 12.76690152(標準偏差) 二つの方法で標準偏差が大きく変わってきてしまいます。。。 どちらの方法をとればよいのでしょうか?教えて下さい よろしくお願いします。