• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:正規分布のグラフを平行移動する方法)

正規分布のグラフをプラスに平行移動する方法

このQ&Aのポイント
  • 正規分布のグラフをプラスに平行移動する方法について教えてください。
  • ハンバーグを作る際の枝豆の数をグラフにすると正規分布になりますが、-3σをプラスにする方法を知りたいです。
  • 平均値に-3σを足すとマイナス値になってしまい、枝豆が1つも入っていないハンバーグが増えてしまいます。他の方法で解決する方法があれば教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
noname#137826
noname#137826
回答No.7

No. 5に追加です。 枝豆が入っていないハンバーグの出現確率を下げようと枝豆の総数を増やすと、ハンバーグ1個あたりの枝豆の個数の期待値は増え(No. 4で書いた通りです)、同時に、枝豆が「たくさん」入ったハンバーグの出現確率も増えます。(当然ですね。) 添付図は、枝豆なしハンバーグの許容確率を0.1%としたときの、ハンバーグ1個あたりの枝豆個数の分布予測です。ポアソン分布と二項分布の両方を示してあります。図を見るとおわかりになると思いますが、「0.1%」が無視できる数値なのだとすると、例えば、枝豆が10個以上入っている確率は無視できない数値になります。 肉に枝豆を入れて混ぜるという確率的な工程をとる限りは、枝豆が入っていないハンバーグの出現確率とともに、ハンバーグ1個あたりの枝豆個数の最大値とそれを超える個数を含むハンバーグの出現確率の許容値も考える必要がありそうです。 もしかしたら、2つの許容値は両立しないかもしれません。その場合、ご質問にある「(4)混ぜる時間を延長する」などの確率論的に理想的な状況に向かうような工程変更は意味をなさないことになります。(「両立しない」という結論がそもそも理想的な状況を仮定して出てきた結果であるためです。)

fukukumoto
質問者

お礼

グラフまでありがとうございます。 良く理解できました。この場合、工程上の予測できない要因を加味したら仰るとおり「二項分布」と「ポアソン分布」のどちらをモデルとするかはそう変わらない気もしています。 ただこの工程を取る場合、「許容値」を下に振るか、上に振るかは判断する必要がありそうです。 たびたび申し訳ございません。 1点のみ教えて頂きたいのですが、この場合の二項分布の式(No.4に記載)は P(N)=(1-N/1000)^30 ではなく P(N)=(1000-N/1000)^30 でしょうか? 私の計算に間違いがあるのかもしれませんので、 確認のためにもご教示頂けるとありがたいです。

fukukumoto
質問者

補足

申し訳ございません。 二項分布式の件ですが、 P(N)={(1-N)/1000}^30と勘違いしておりました。 なので問題ないです。ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (6)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.6

#3です。 疑問をお持ちになった点について説明します。 (1) ポアソン分布は、確率が非常に小さい場合のことか? 答:確率が非常に小さくて、試行回数が非常に多く、その結果、出現数がそれほど小さすぎたり大きすぎたりしない場合に使う分布です。例えば、北海道で高額当選が多く出た!という場合「驚くか」「さほど驚かないか」という問題です。 宝くじは、なかなか当たりませんが、非常にたくさん買えば、そこそこの当選数になるはずです。ですから、どこかの売り場でたくさんの当選が出ても、統計学者は、そんなに驚きません。 (2) ポアソン分布と二項分布の使い分け 答:宝くじを1億枚買ったときでも、厳密には2項分布なので、(0.99999999+0.00000001)^100000000 を2項展開するのが本道です。しかし、展開式の最初のほうは、(0.999999+0.000001)^1000000と、ほとんど同じであり、百万でも10億でも1兆でも変わりありません。ですから展開式の端のほうだけ見るときはポアソン分布で、真ん中寄りも問題にするときには二項分布という使い分けをします。使い分けは、精度と労力の兼ね合いで決めるのです。さらに、日本中の宝くじの半分も買ってしまうような人がいたら、今度は、二項分布も労力がもったいないので、正規分布の出番となります。

fukukumoto
質問者

お礼

重ね重ね、ありがとうございます。 ■(1)について 宝くじの話は何となくわかりました。 試行回数が非常に多いと言うのは、ある程度結果にブレがないことが前提と言う事でしょうか。今回の「枝豆」の問題では、皆さん真っ先に「ポアソン分布」をアドバイスして下さいましたが、その根拠がいまいち理解しきれていなかったため、ご質問させて頂きました。 ■(2)について 精度と労力の兼ね合いですか。 何をどの程度正確に知りたいかで変わってくると言うことですね。今回のケースでは、工程上予測できない要因も後々多く関わるため「二項分布」も「ポアソン分布」も同程度と見なして取り組んでみます。 ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。
noname#137826
noname#137826
回答No.5

二項分布だとすると・・・1000gの肉を「適度に」(*)広げた後、1gずつ1000個の等面積なセルに区切っておき、その上から枝豆50個をランダムにばらまいた、という状況を考えればよいのかもしれません。1つのセルには1個の枝豆が乗っているかいないかのどちらかであるとします。 (*)肉を極端に薄く広げると1つのセルに2つ以上の豆が入り得ることになります。そうはならずに1gの肉からなる1つのセルに入る枝豆の個数は最高1個であるように広げることを「適度に」と表現しています。 このとき、あるセルに枝豆が乗っている確率pは50/1000=1/20です。このようなセル30個からなる集団(1個30gのハンバーグに相当します)に含まれる枝豆の個数の分布は p = 1/20, n = 30 の二項分布になるでしょう。 グラフを描いてみるとわかりますが、p = 1/20, n = 30 の二項分布と、m = 1.5 のポアソン分布はよく似ています。実際にハンバーグを作ってみた結果がどちらの分布になるのかおそらく区別はつかないだろうと思います。 どちらの分布であるか区別をつける必要があるとすれば、枝豆の総数Nを増やしたときの、枝豆が入っていないハンバーグの出現確率P(N)が大きく異なる場合です。 ポアソン分布の場合は、No. 4にも書いた通り、P(N) = exp(-3N/100) です。一方、上記のような考え方の二項分布では P(N) = (1-N/1000)^30 となります。この二項分布の場合には P = 0.01 にするには N ~ 143 P = 0.001 にするには N ~ 206 となります。つまり、ハンバーグ1個あたりの枝豆の個数は二項分布であると仮定した場合の方が、枝豆が入っていないハンバーグの出現確率を低くするのに必要な枝豆の総数が少ないことになります。工業的な生産規模の場合には、両者の予測の差は無視できないほど大きな利益の差を生むことになるのでしょうか?そうだとすると、私のような素人の数字遊びではなく、もっと統計に通じた人の責任ある回答を得るべきだと思います。 以前に回答を書いたときにも疑問に思ったのですが、枝豆が入っていないハンバーグの許容確率はどの程度なのでしょうか? 仮に0.1%(P=0.001)だとします。すると、ハンバーグ1個あたりの枝豆の個数の期待値は6.18(二項分布)あるいは6.9(ポアソン分布)となります。つまり、ハンバーグ1個当たり6-7個の枝豆が入っていることになります。ご質問にあるケースでは1.5個だったわけですから、実に4倍です。こうなるとハンバーグの味などが変わってくるのではないかと想像します。こうなると、0.1%を許容できても、肝心のハンバーグの味が許容できない、ということにはならないでしょうか?そうだとすると、枝豆をハンバーグに入れる工程を工夫する必要がある、ということになるのかもしれません。

fukukumoto
質問者

お礼

重ね重ね、ご丁寧にありがとうございました。 >枝豆が入っていないハンバーグの許容確率はどの程度なのでしょうか? このご質問についてですが、メーカーによって異なるとも思いますが、私の回りだと「0.3%」程度です。数字の根拠は3σの「99.7%」から来ておりますが、明確に「どの程度までならOK」と言った取り決めがあるわけではありません。(実際に0.3%を逸脱するものもあります。) つまり、Kaorineさんの仰る通りなのですが、「ハンバーグの味」「食感」と言った「品質」と天秤にかけ、どの程度まで許容できるか?と言った判断をその都度することになります。 例えば今回のケースなら、設計時に「枝豆なしハンバーグ」の発生率を推測できたとして、その後に  (1)枝豆の絶対量は変更しない。枝豆をカットしてパーツ数を増やす。  (2)枝豆の絶対量を増やし、品質が許容できるか判断する。  (3)全てのハンバーグに枝豆が入るように、手作りで2粒ずつ入れるなど大幅な工程変更をする。 などの中から選択する事になります。 今回の問題の解決にあたり統計の本をいくつか読んだ中に記載されていたことですが、「全ての事象はN数(側定数)を増やせば正規分布で説明できる」と言ったいわゆる「正規分布信奉」のようなものが私の周りにもあり、他の分布について考慮することができておりませんでした。 今回のケースなどは側定数をいくら増やしたところで「1つあたりに含まれる枝豆個数の期待値」を増やさなければ分布は正規分布(正確には離散型の分布なので「ぽい」形ではありますが)には近づかないわけですから、いかに上記の様な信奉が役に立たないか痛感した次第です。 重ね重ね、ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。
noname#137826
noname#137826
回答No.4

枝豆を入れて混ぜた肉からハンバーグを作るという工程を取る限りは、枝豆の入っていないハンバーグが出現する確率は0にはならないでしょう。しかし、小さくすることは可能だと思います。 ポアソン分布で考えてよい(少なくとも、よい近似になっている)とします。すると、枝豆が一つも入っていないハンバーグが見つかる確率は P = exp(-λ)になります。λはハンバーグ1個あたりの枝豆の個数の平均値、 λ = N/(1000/30) = 3N/100 です。N は枝豆の総数です。つまり、P は N の関数として P(N) = exp(-3N/100) と表されることがわかります。ご質問の N = 50 の場合では、P ~ 0.22 です。5個に1個くらいは、枝豆が入っていないハンバーグがあることになります。 では、P を小さくするには N をどれくらい大きくすればよいでしょう?計算してみると、 P = 0.01 にするには、N ~ 154 P = 0.001 にするには、N ~ 230 ということがわかります。

fukukumoto
質問者

お礼

遅くなり大変申し訳ございません。 ご丁寧なご回答、誠にありがとうございました。 これを機会に、ポアソン分布、2項分布についても調べてみましたが、両者をどういった場合に使い分けたらよいのか、いまいち分かりません。 二項分布の式においてm=npの値(m=n回の試行の間に確率pの事象が起こる回数の平均値)を固定したまま、pを0.1以下に、nを50以上にした場合「ポアソン分布」が成立するらしいのですが、 今回の枝豆の場合はn=50、p=3/100で良いのでしょうか? (ポアソン分布式をP(r)=m^r/r!*exp^-m とする) もしお読みになられましたら、ご教示頂けたら幸いです。

全文を見る
すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

> 枝豆の入っていないハンバーグの割合を、予測する事はできるのでしょうか できます。 平均は50*0.03=1.5粒ですよね。 ポアソン分布表から、μ=1.5、x=0を調べると p=0.223 となります。

参考URL:
http://www.sci.kagoshima-u.ac.jp/~ebsa/wakimoto03/contents.html
fukukumoto
質問者

お礼

遅くなり大変申し訳ございません。 ポアソン分布についても調べたら、上記のようになりました。 ありがとうございました。 ただ、ポアソン分布は「極めて小さい確率の場合」とのことなので、 今回のケースが「小さい」と言えるのか疑問はやや残ります。

全文を見る
すると、全ての回答が全文表示されます。
noname#137826
noname#137826
回答No.2

No. 1の方も指摘されていますが、枝豆の個数は正規分布ではありませんね。ポアソン分布が近いでしょう。 参考URLはWikipediaの説明です。「事象」の欄に書かれている例と比較すると、枝豆の例もこれらと類似していることがお分かりになると思います。 ハンバーグ一つあたりの枝豆の個数の期待値は1.5個ですから、実際にハンバーグを作ってその中にある枝豆の個数の分布を作ると、λ=1 と λ=2 の間のような分布になるのではないでしょうか。

参考URL:
http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83
fukukumoto
質問者

補足

参考URLありがとうございます。 仰るとおり、「ポアソン分布」が近いかと思います。 この場合、「枝豆が入っていないハンバーグ」の推測と、 発生しなくなる方法について求めることはできないでしょうか。

全文を見る
すると、全ての回答が全文表示されます。
  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

確認したいのですが, 1 kg のひき肉の中に 50個の枝豆を入れて混ぜたあと 30 g ずつ小分けにした場合, 本当に「枝豆の個数をグラフにすると正規分布になります」か? 実際に試したんでしょうか? なんとなくですが, 「正規分布である」という前提が既におかしな気がします. 「枝豆が 0.9個入っている」とか「こっちには 1.4個入っている」とかいう状況が想像できないのですが....

fukukumoto
質問者

補足

ありがとうございます。 実際、枝豆はもう少し大目の数で実験しましたが、「正規分布っぽい」分布にはなります。 仰るとおり、「離散型の分布」の方が考え方としては合っているのかもしれません。 「離散型の分布」に関しては知見が浅くて申し訳ないのですが、その場合「枝豆の入っていないハンバーグ」の割合を、予測する事はできるのでしょうか?

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • 正規分布とヒストグラフ

    現在、得られたデータをヒストグラムにして、正規分布と比べています。 得られたデータ(100個)の度数分布をヒストグラフにし、計算により、標準偏差と平均を求めました。 さらに、正規分布の式、f(x)=1/(σ*√2π)exp(-(x-μ)^2/(2σ^2))へ求めた標準偏差と平均を入れ、計算し、f(x)のグラフを描きました。 この二つのグラフを比較し、ズレがないことを視覚的に確認しようとしています。 ですが、エクセルにて比較したところ、概形は同じですが縦軸の目盛りが異なります。 正規分布は縦軸がf(x)で、ヒストグラフは縦軸が度数です。 概形は同じですが縦軸が一桁ほど違う形となっています。 具体的には、ヒストグラフの縦軸をちょうど10倍ほどすると正規分布の縦軸と同じになり、グラフがちょうどよく重なります。 ですが、合わせるためにちょうどいい数字の倍数していいとは思えませんし、軸の数字が違うものを比べるということ自体ができないと思います。 ということは比べる前に何かしらの比較するための計算を(何かをかけるとか)していないということになるのでしょうか。 そのままf(x)と度数を比べられるとは思いませんが、比べるためにはどういった計算処理をしなければいけないのでしょうか。 参考書や過去の質問も参照しましたが、なかなか理解できず質問させていただきました。 わかりづらい質問で恐縮ですが、ご教授よろしくお願いします。

  • 正規分布のグラフ作成について

    株価の前日からの騰落率の分布をEXCELで計算したいのですが、正規分布の計算やグラフはどのように作成すればよろしいでしょうか? いろんなサイトを見ているのですが解説がながくて理解しずらいものですから単純に操作手順を書いていただけるとありがたいです。ちなみに○○から■■のデータは全体のどれくらいかはNORMDIST(○○,平均値,標準偏差,TRUE)-NORMDIST(■■,平均値,標準偏差,TRUE)と検索したサイトに書いてありましたがこの式や計算結果データは関係ないのでしょうか?山のような形をしたグラフで68%に収まる前日からの騰落率はどの範囲かを把握できる程度の簡単なものを求めています。よろしくお願いいたします。

  • 正規分布のグラフ

    エクセルで正規分布曲線のグラフを描きたいのですが書き方が分かりません。平均値から標準偏差の0.5σの間隔で左右対称の曲線を描きたいです。エクセルでどの関数を使ってどのように書いたらいいかご存知の方お願い致します。ちなみに平均値は5339で標準偏差は1215で度数は25です。よろしくお願い致します。

  • 正規分布と尖度

    こんにちは。 今僕は卒業研究の一部で尖度について勉強しています。 少しわからないことがあったので質問させてください。 1◆正規分布は、平均を中心に左右対称の釣鐘形をした分布である  ◆尖度は正規分布のときに尖度=3となり、尖度が大きいと 正規分布より尖ったグラフになる。小さいと平らなグラフになる。 これらの定義は合っていますか? 2◆色々なサイトに『尖度が3より大きくなると正規分布より尖ったグラフになる』 とありましたが、そのグラフも正規分布の特徴と当てはまっている気がしました。 そうすると、『正規分布より尖ったグラフ』という表現がおかしいように思えるのですが…。 ここをどう説明すればいいのかわからず困っています。 統計学の知識はほとんどないので、馬鹿な質問かもしれませんがわかりやすく教えていただけると嬉しいです。

  • 正規分布を両対数グラフにプロットする

    正規分布している事象があるとして(例えば、身長と個体数)、 身長を横軸、縦軸を累積度数にして両対数グラフ上にプロットすると曲線を描きますよね? この曲線を一般的に式に表すとどういった式になるのでしょうか。 適当にモデルを作って軽く計算してみたのですが、こんがらがってしまいました・・・・ ベキ乗則に従う事象と正規分布する事象を同じ両対数グラフ上にプロットして、さらに回帰曲線をひきたいのです。 どうかよろしくお願いいたします。

  • 正規分布 性質

    あるXに対して、確率変数Yは正規分布 平均値=2X+1 標準偏差σ=1 グラフから見ると平均値の集合は直線です。聞きたいのは、これらの正規分布を合わせて、一つの何かの分布になりませんか

  • 正規分布ではない分布について

    確率・統計の質問です。 正規分布を仮定すると平均値-2σくらいで 物理的にはありえない負の数をとる場合 (例えば含有率や面積率など) どういった分布を仮定すれば良いのでしょうか? なにか良い方法があれば教えてください。 β分布やΓ分布を使うのでしょうか?

  • 正規分布の加法性について(平均値の求め方)

    正規分布の加法性について(平均値の求め方)について教えてください。 たとえば,1つの正規分布の平均値が100,もう1つの正規分布の平均値が110で,この2つの正規分布の「差」を求める場合,平均値は10になるのでしょうか,それともマイナス10になるのでしょうか。 「常に大きい値から小さい値を引く」というようなルールはあるのでしょうか。

  • 正規分布の加法性(平均値の求め方)について その2

    正規分布の加法性(平均値の求め方)について再び質問します。 昨日,質問して数人の方から親切な回答をいただいたのですが,私の質問の仕方が悪かったため,疑問がいま一つ解消できていません。 ここに,2種類の正規分布があるとします。話をわかりやすくするために,1つは女性の平均身長 N(NA,SA^2),もう1つは男性の平均身長 N(NB, SB^2)とします。「女性と男性の平均身長の差」を求めるために,女性の平均身長から男性の平均身長を引いて新しい正規分布を求めたとします。このとき,新しい正規分布は,正規分布の加法性にしたがって,N(NA-NB, √SA^2+SB^2)となりますよね。 この,新しい正規分布の平均値NA-NBについてなのですが,一般的に言って女性のほうが男性より身長が低いことが多いので,この値はマイナスになると思います。でも,逆にNB-NAとすればプラスになるでしょう。この2つの正規分布は同じものと考えて良いのでしょうか。