• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:正規分布のグラフを平行移動する方法)

正規分布のグラフをプラスに平行移動する方法

noname#137826の回答

noname#137826
noname#137826
回答No.5

二項分布だとすると・・・1000gの肉を「適度に」(*)広げた後、1gずつ1000個の等面積なセルに区切っておき、その上から枝豆50個をランダムにばらまいた、という状況を考えればよいのかもしれません。1つのセルには1個の枝豆が乗っているかいないかのどちらかであるとします。 (*)肉を極端に薄く広げると1つのセルに2つ以上の豆が入り得ることになります。そうはならずに1gの肉からなる1つのセルに入る枝豆の個数は最高1個であるように広げることを「適度に」と表現しています。 このとき、あるセルに枝豆が乗っている確率pは50/1000=1/20です。このようなセル30個からなる集団(1個30gのハンバーグに相当します)に含まれる枝豆の個数の分布は p = 1/20, n = 30 の二項分布になるでしょう。 グラフを描いてみるとわかりますが、p = 1/20, n = 30 の二項分布と、m = 1.5 のポアソン分布はよく似ています。実際にハンバーグを作ってみた結果がどちらの分布になるのかおそらく区別はつかないだろうと思います。 どちらの分布であるか区別をつける必要があるとすれば、枝豆の総数Nを増やしたときの、枝豆が入っていないハンバーグの出現確率P(N)が大きく異なる場合です。 ポアソン分布の場合は、No. 4にも書いた通り、P(N) = exp(-3N/100) です。一方、上記のような考え方の二項分布では P(N) = (1-N/1000)^30 となります。この二項分布の場合には P = 0.01 にするには N ~ 143 P = 0.001 にするには N ~ 206 となります。つまり、ハンバーグ1個あたりの枝豆の個数は二項分布であると仮定した場合の方が、枝豆が入っていないハンバーグの出現確率を低くするのに必要な枝豆の総数が少ないことになります。工業的な生産規模の場合には、両者の予測の差は無視できないほど大きな利益の差を生むことになるのでしょうか?そうだとすると、私のような素人の数字遊びではなく、もっと統計に通じた人の責任ある回答を得るべきだと思います。 以前に回答を書いたときにも疑問に思ったのですが、枝豆が入っていないハンバーグの許容確率はどの程度なのでしょうか? 仮に0.1%(P=0.001)だとします。すると、ハンバーグ1個あたりの枝豆の個数の期待値は6.18(二項分布)あるいは6.9(ポアソン分布)となります。つまり、ハンバーグ1個当たり6-7個の枝豆が入っていることになります。ご質問にあるケースでは1.5個だったわけですから、実に4倍です。こうなるとハンバーグの味などが変わってくるのではないかと想像します。こうなると、0.1%を許容できても、肝心のハンバーグの味が許容できない、ということにはならないでしょうか?そうだとすると、枝豆をハンバーグに入れる工程を工夫する必要がある、ということになるのかもしれません。

fukukumoto
質問者

お礼

重ね重ね、ご丁寧にありがとうございました。 >枝豆が入っていないハンバーグの許容確率はどの程度なのでしょうか? このご質問についてですが、メーカーによって異なるとも思いますが、私の回りだと「0.3%」程度です。数字の根拠は3σの「99.7%」から来ておりますが、明確に「どの程度までならOK」と言った取り決めがあるわけではありません。(実際に0.3%を逸脱するものもあります。) つまり、Kaorineさんの仰る通りなのですが、「ハンバーグの味」「食感」と言った「品質」と天秤にかけ、どの程度まで許容できるか?と言った判断をその都度することになります。 例えば今回のケースなら、設計時に「枝豆なしハンバーグ」の発生率を推測できたとして、その後に  (1)枝豆の絶対量は変更しない。枝豆をカットしてパーツ数を増やす。  (2)枝豆の絶対量を増やし、品質が許容できるか判断する。  (3)全てのハンバーグに枝豆が入るように、手作りで2粒ずつ入れるなど大幅な工程変更をする。 などの中から選択する事になります。 今回の問題の解決にあたり統計の本をいくつか読んだ中に記載されていたことですが、「全ての事象はN数(側定数)を増やせば正規分布で説明できる」と言ったいわゆる「正規分布信奉」のようなものが私の周りにもあり、他の分布について考慮することができておりませんでした。 今回のケースなどは側定数をいくら増やしたところで「1つあたりに含まれる枝豆個数の期待値」を増やさなければ分布は正規分布(正確には離散型の分布なので「ぽい」形ではありますが)には近づかないわけですから、いかに上記の様な信奉が役に立たないか痛感した次第です。 重ね重ね、ありがとうございました。

関連するQ&A

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • 正規分布とヒストグラフ

    現在、得られたデータをヒストグラムにして、正規分布と比べています。 得られたデータ(100個)の度数分布をヒストグラフにし、計算により、標準偏差と平均を求めました。 さらに、正規分布の式、f(x)=1/(σ*√2π)exp(-(x-μ)^2/(2σ^2))へ求めた標準偏差と平均を入れ、計算し、f(x)のグラフを描きました。 この二つのグラフを比較し、ズレがないことを視覚的に確認しようとしています。 ですが、エクセルにて比較したところ、概形は同じですが縦軸の目盛りが異なります。 正規分布は縦軸がf(x)で、ヒストグラフは縦軸が度数です。 概形は同じですが縦軸が一桁ほど違う形となっています。 具体的には、ヒストグラフの縦軸をちょうど10倍ほどすると正規分布の縦軸と同じになり、グラフがちょうどよく重なります。 ですが、合わせるためにちょうどいい数字の倍数していいとは思えませんし、軸の数字が違うものを比べるということ自体ができないと思います。 ということは比べる前に何かしらの比較するための計算を(何かをかけるとか)していないということになるのでしょうか。 そのままf(x)と度数を比べられるとは思いませんが、比べるためにはどういった計算処理をしなければいけないのでしょうか。 参考書や過去の質問も参照しましたが、なかなか理解できず質問させていただきました。 わかりづらい質問で恐縮ですが、ご教授よろしくお願いします。

  • 正規分布のグラフ作成について

    株価の前日からの騰落率の分布をEXCELで計算したいのですが、正規分布の計算やグラフはどのように作成すればよろしいでしょうか? いろんなサイトを見ているのですが解説がながくて理解しずらいものですから単純に操作手順を書いていただけるとありがたいです。ちなみに○○から■■のデータは全体のどれくらいかはNORMDIST(○○,平均値,標準偏差,TRUE)-NORMDIST(■■,平均値,標準偏差,TRUE)と検索したサイトに書いてありましたがこの式や計算結果データは関係ないのでしょうか?山のような形をしたグラフで68%に収まる前日からの騰落率はどの範囲かを把握できる程度の簡単なものを求めています。よろしくお願いいたします。

  • 正規分布のグラフ

    エクセルで正規分布曲線のグラフを描きたいのですが書き方が分かりません。平均値から標準偏差の0.5σの間隔で左右対称の曲線を描きたいです。エクセルでどの関数を使ってどのように書いたらいいかご存知の方お願い致します。ちなみに平均値は5339で標準偏差は1215で度数は25です。よろしくお願い致します。

  • 正規分布と尖度

    こんにちは。 今僕は卒業研究の一部で尖度について勉強しています。 少しわからないことがあったので質問させてください。 1◆正規分布は、平均を中心に左右対称の釣鐘形をした分布である  ◆尖度は正規分布のときに尖度=3となり、尖度が大きいと 正規分布より尖ったグラフになる。小さいと平らなグラフになる。 これらの定義は合っていますか? 2◆色々なサイトに『尖度が3より大きくなると正規分布より尖ったグラフになる』 とありましたが、そのグラフも正規分布の特徴と当てはまっている気がしました。 そうすると、『正規分布より尖ったグラフ』という表現がおかしいように思えるのですが…。 ここをどう説明すればいいのかわからず困っています。 統計学の知識はほとんどないので、馬鹿な質問かもしれませんがわかりやすく教えていただけると嬉しいです。

  • 正規分布を両対数グラフにプロットする

    正規分布している事象があるとして(例えば、身長と個体数)、 身長を横軸、縦軸を累積度数にして両対数グラフ上にプロットすると曲線を描きますよね? この曲線を一般的に式に表すとどういった式になるのでしょうか。 適当にモデルを作って軽く計算してみたのですが、こんがらがってしまいました・・・・ ベキ乗則に従う事象と正規分布する事象を同じ両対数グラフ上にプロットして、さらに回帰曲線をひきたいのです。 どうかよろしくお願いいたします。

  • 正規分布 性質

    あるXに対して、確率変数Yは正規分布 平均値=2X+1 標準偏差σ=1 グラフから見ると平均値の集合は直線です。聞きたいのは、これらの正規分布を合わせて、一つの何かの分布になりませんか

  • 正規分布ではない分布について

    確率・統計の質問です。 正規分布を仮定すると平均値-2σくらいで 物理的にはありえない負の数をとる場合 (例えば含有率や面積率など) どういった分布を仮定すれば良いのでしょうか? なにか良い方法があれば教えてください。 β分布やΓ分布を使うのでしょうか?

  • 正規分布の加法性について(平均値の求め方)

    正規分布の加法性について(平均値の求め方)について教えてください。 たとえば,1つの正規分布の平均値が100,もう1つの正規分布の平均値が110で,この2つの正規分布の「差」を求める場合,平均値は10になるのでしょうか,それともマイナス10になるのでしょうか。 「常に大きい値から小さい値を引く」というようなルールはあるのでしょうか。

  • 正規分布の加法性(平均値の求め方)について その2

    正規分布の加法性(平均値の求め方)について再び質問します。 昨日,質問して数人の方から親切な回答をいただいたのですが,私の質問の仕方が悪かったため,疑問がいま一つ解消できていません。 ここに,2種類の正規分布があるとします。話をわかりやすくするために,1つは女性の平均身長 N(NA,SA^2),もう1つは男性の平均身長 N(NB, SB^2)とします。「女性と男性の平均身長の差」を求めるために,女性の平均身長から男性の平均身長を引いて新しい正規分布を求めたとします。このとき,新しい正規分布は,正規分布の加法性にしたがって,N(NA-NB, √SA^2+SB^2)となりますよね。 この,新しい正規分布の平均値NA-NBについてなのですが,一般的に言って女性のほうが男性より身長が低いことが多いので,この値はマイナスになると思います。でも,逆にNB-NAとすればプラスになるでしょう。この2つの正規分布は同じものと考えて良いのでしょうか。