• ベストアンサー

確率はゼロだが可能性がないとはいえないこと

Xが連続的な確率分布、たとえば正規分布に従うとき、Xが特定の値aを取る確率はP(X=a)=0になりますが、X=aとなる可能性がないとはいえませんよね? 世間一般の感覚では、確率=0というと可能性が全くないと認識されていると思います。 そこで質問ですが、そのような可能性の有無を含めて表現できるようなある種の指標のようなものを考えることは可能でしょうか?その指標の値を知れば、少なくともその事象の可能性がまったくないかそうでないかが判断できるようなもので、しかも欲を言うと可能性の大小の評価がまるで確率の値を知るように与えられるようなもののことです。

noname#152584
noname#152584

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

> Xが特定の値aを取る確率はP(X=a)=0になりますが、X=aとなる可能性がないとはいえませんよね?  「ある連続な分布φに従う確率変数Xが何らかの値cを取ったとする。Xが値cを取る確率はP(X=c)=0であるから、そんなことが起こる筈がない。だからXはどんな値も取りえない」 というパラドックスを提起なさっている。ゼノンのパラドックスの確率バージョンみたいで、実に面白いですね。すばらしい発想だと思います。  まさにこのパラドックスが示す通り、連続な確率変数Xがある特定の値aを取る確率P(X=a)を計算しようとしたらおかしなことになりますね。  実は、連続値の場合の「確率」ってのは確率密度φでしか与えられません。例えば、   P(a-Δx < X < a+Δx ) = 2Δxφ(a) のように、確率密度φに幅2Δxをかけ算して初めて確率になるんです。  これは現実の話とうまく整合した概念です。というのは、「Xが特定の値を取った」と言っても、その値はある精度でしか決まらない。いくらかの不確かさを持っています。だから「Xが取った値は無理数であるか有理数であるか」なんて問いは意味をなさないでしょう。  つまり、Xが取りうる値というのは、ひとつの実数aではなく、(φに比べてずっと小さな分散を持つ)ある分布ψだ、と考えねばなりません。Xの値がψに入る実数だというのではなくて、Xの値とはψそのものである、という話です。すると、Xの値がこの分布ψになる確率は   P(ψ) = ∫φ(x)ψ(x)dx によって計算され、φ(x)とψ(x)が重なりを持っていればP(ψ)は0でない数値になるわけです。  そこでご質問に戻るなら、φは既知だとして、分布ψの分散を決めるのは何かというと、「Xが特定の値aを取ったかどうか」の判定基準(許される誤差)のキツさである。言い換えれば、Xの値の測定手段が持つ精度によって決まるということです。かくて、 > 可能性の大小の評価がまるで確率の値を知るように与えられるようなもののことです の答は、まさしく上記の積分にほかなりません。  さて、以上の話とはまた別の次元の話として、「確率と統計は違うよ」ということがあります。  確率というのは、いくつかの仮定を置いて、「その仮定が完全に正しいなら」という前提で導き出される数学の定理です。「その仮定が完全に正しいなら」という所を現実には保証できない以上、確率は現実そのものを写している訳ではない。はっきり言えば「現実とは関係がない」のです。  一方、統計は、過去に生じた事象を沢山集積して、「今後も同じように物事が起こるとすれば」という前提で予測をしようとする。(科学はすべてこれです。)その際に、「今後も同じように物事が起こるとすれば」という仮定に加えて、「これまで起こった物事は、ある性質を満たしているように思われる」という洞察をたよりにいくつかの仮定を置いて、「その仮定が完全に正しいなら」という前提で数学によって確率を導く。そして、それを現実に応用してみるのです。  ですから、統計による予測がまるではずれても、「沢山集積した、過去に生じた事象」が不足だった、そこから洞察した「これまで起こった物事は、ある性質を満たしているように思われる」という考え(法則)が間違っていた、そして「今後も同じように物事が起こるとすれば」という訳には行かなかった、などが分かるだけのことです。  従って、現実の事象について > その指標の値を知れば、少なくともその事象の可能性がまったくないかそうでないかが判断できる ような指標がもし作れるなら、それは「統計による予測の根拠(たとえば「Xがある確率分布に従うとき」という前提)がどのぐらいしっかりしているか。どうやってその予測を導いたのか」を評価することによって計算されるような指標である筈だ、と分かりますね。

noname#152584
質問者

お礼

分布ψの考え方は面白いと思いました。 ありがとうございました。

その他の回答 (8)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.9

ANo.6へのコメントについてです。  うわ、ずいぶんとお詳しい。どうやら釈迦に説法をしてしまったようだ。  仰る通り、ディラックのδ関数は測度とはまた違う方向からのアプローチですね。ψの幅がうんと狭くなった極限、もう普通の意味での関数ではなくなってしまったのがδ関数だから、{x|δ(x)≠0}の測度はどう測っても0なのに積分は1になる。そこでNo.6の積分でψをδに変えてみますと、積分の結果はやはり確率密度φとなって元の木阿弥。Xがたとえばぴったり√2になる確率は0のままです。  やっぱり「X=aとなる可能性」じゃなく、「もうaと一緒ってことで良いじゃんと思える幅Δaについて|X-a|<Δaとなる可能性」を考えるのが限界なんでしょう。そのとき、有限の幅を持って「もうaと一緒ってことで良いじゃん」と言う場合も、また、その幅がaに依っていろいろ異なる場合も、あるいは(その可能性/Δa)の極限としての確率密度まで行かなきゃ気が済まない場合も、そして測定の不確かさによって否応なく幅が出来てしまう場合も、確率密度(φ・ψ)ならみんなψに織り込んでしまえるんで、「可能性の大小の評価がまるで確率の値を知るように与えられるようなもの」にはぴったしかな、と思うわけです。

noname#152584
質問者

お礼

> 「もうaと一緒ってことで良いじゃんと思える幅Δaについて|X-a|<Δaとなる可能性」を考えるのが限界なんでしょう なるほど、でも実際のところはその手法を使ってうまく処理できるというわけですね。 何度もお付き合いいただきありがとうございました。

  • kskz
  • ベストアンサー率0% (0/1)
回答No.8

No.1, 2への補足についてですが >根元事象全体の集合Ωの部分集合Aについて、Aの確率P(A)が定義されるときに「Aが発生する可能性がある」、P(A)=0のときにAの確率が0、という意味で可能性という言葉をここでは使っています。 「可能性の有無」をそのように定義すると、すべての事象(事象全体の集合は確率空間によってすでに定義されている)は起こる可能性がある、 また実数のすべてのボレル可測集合BについてX∈Bは起こる可能性がある、 ということになります。 この理解で合っていますか。 さらに「可能性の大小」を評価する数値を考えるとは、どのようなことを念頭に置いているのでしょうか? 上記の意味で可能性のある事象に1、可能性のない事象(存在しない)に0を割り当てる、ということではもちろんないと思うのですが。 「可能性」によって事象を区別するとは、(直観的にでもよいので)どのような意味なのですか?

noname#152584
質問者

お礼

ありがとうございました。

noname#152584
質問者

補足

ご指摘の補足は正確な表現ではありませんでした。 そのご回答だと、「可能性がある」の条件をAとしてAの定義関数を与えればおしまいとなります。 何がいいたいかというと、トートロジー。

  • momordica
  • ベストアンサー率52% (135/259)
回答No.7

勘違いだったらすみません。 確率密度関数が、質問者さんのおっしゃる「指標」そのものではないかと思うのですが。 例えば、平均0、分散1の正規分布の確率密度関数は  f(x)=1/√(2πe^(x^2)) ですが、実際の確率はこの関数を積分したものであり、この関数自体は確率そのものではありません。 例えば  f(1)=1/√(2πe)=0.241970725  f(2)=1/√(2πe^4)=0.053990967 ですが、これらはそれぞれx=1, x=2となる確率というわけではありません。 しかしながら、f(1)とf(2)を比較すれば、この確率分布において、x=1となることは、x=2となることに 比べて5倍近く起こりやすい事象であると評価することはできるでしょう。 これはもちろん正確な表現ではなく、実際にはxが「1に極めて近い数値」になるという事象が起こる 確率と「2に極めて近い数値」になるという事象を比較しているということですが。 また、あるxについてf(x)=0であれば、xがその値になることは真の意味で「決して起こらない事象」 ということです。(もちろん、正規分布ではありえません)

noname#152584
質問者

お礼

もちろんfの値は確率ではありませんよ。積分しないといけません。 絶対連続な場合一点集合上の積分は明らかにゼロになってしまうわけですし、特異部分を補っても限界があるので、測度以外の道具は何かないかなと思った次第です。 でも気分としては質問の趣旨に沿った認識をいただいたようです。fだと複雑なので他にないかなぁというものです。 ありがとうございました。

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.6

ANo.4の前半部分、追記です。  昔は「真値」「誤差」という言葉を使って、「Xの値(測定値)がaのとき、真値vは v = a - εである。ここにεは誤差で、これは確率分布ξ(x)に従う確率変数である」という風に捉えることが多かったのですが、今では「不確かさを伴わない測定はなく、従って、そもそも真値なんてものはない」という考え方が主流で、たとえばISO規格においても「真値」という概念は一切排除されています。(ま、あまりうるさいことを言わなければ大抵 v = a - ε で事足りるのですけれども。)  つまり、「本質的に、実数aの周りに不確かさがくっついているものψ(x)しか得られない」と考える。なので「測定値はaだ」というのは、「 ψ(x)=ξ(x-a)である(ただし、不確かさの分布ξ(x)は平均が0)」ってことです。(No.5さんの「ビュッフォンの針」の場合も、この考え方をすれば変な事は起こりません。)  さてNo.4の   P(ψ) = ∫φ(x)ψ(x)dx のところをもう少し正確に説明すると、実はこの積分は確率密度を与えます。すなわち微小な区間(s, s+Δs)について、ξ(x-a)のaがその区間に入る確率を考えると、   P(a∈(s, s+Δs)) =Δs ∫[t=-∞ ~∞] φ(t)ξ(s-t)dt ということを意味しています。  これがどうやって出て来るか、簡単に考え方を紹介しますと、φ(x)に従う確率変数Xが微小区間(t, t+Δt)に入る確率は   P(x∈(t, t+Δt))=φ(t)Δt また、x∈(t, t+Δt)のとき測定値ξ(x-a)のaがa∈(s, s+Δs)である確率は、   P(a∈(s, s+Δs) | x∈(t, t+Δt))    = ∫[a∈(s, s+Δs)]( ∫[x∈(t, t+Δt)](ξ(a-x)/Δt) dt )ds    = ξ(s-t)Δs なので、φ(x)に従う確率変数xの測定値ξ(x-a)のaが微小な区間(s, s+Δs)に入る確率は   P(a∈(s, s+Δs)) = ∫[t=-∞~∞] ( P(a∈(s, s+Δs)|x∈(t, t+Δt))(P(x∈(t, t+Δt))/Δt) )dt    = Δs∫[t=-∞~∞](φ(t)ξ(s-t)) dt  「測定の話じゃなくて、純粋に数学的な扱いではどうなっているか」というと、こちらは「測度」という概念が不可欠です。最近似たような話をいくつか書いたな →  http://okwave.jp/qa/q7391540.html  http://okwave.jp/qa/q7418906.html ちうわけで、やはり「無限集合の中のあるひとつの値が実現する確率、というものは0だけれども、有限の測度をもつ部分集合(上記の{x|φ(x)>0}に相当)の中に落ちる確率なら計算できる」という仕組みになっているんです。  別の言い方をすると、確率が0の事象を有限個合わせた集合Aを考えても、「集合Aの要素のどれかが実現する確率」はやはり0。しかし無限個集めたとなると話が違う。その場合、ただ無限個と言っただけでは答が決まらないんで、無限集合の大きさを数値的に表す必要がある。それが「測度」だ、というわけです。

noname#152584
質問者

お礼

興味深いお話ありがとうございました。

noname#152584
質問者

補足

要するにトータルマス1に対して”針”の落ちる狭い部分の面積が0でないから比で表せば0ではないということですよね? 評価がψに依存するのがちょっとひっかかります。 ディラックδの近似列を打ち切ったものの一つでしょうか? 打ち切るところが気持ち悪いです。

noname#221368
noname#221368
回答No.5

 ある種の指標のようなものは、やっぱり現行の確率になると思うんです。  ただし連続確率分布の場合、x=aの確率0は、   ・aにまぐれ当りする確率は、限りなく0に近い. の意味に取る必要はあると思います。以下、ものすごぉ~く、大雑把です。  サイコロの1の目が出る確率は1/6の意味を、   a)サイコロを数回ふったくらいでは出ないだろう.   b)でも6回ふったら、1回は出そうだ(もちろん出ない時もある). だとします。しますが、a),b)は、初回で1の目が出るケースを否定はしません。  同様に、x=aにまぐれ当たりする確率0は、   c)有限回の試行では、まず当たらない.   d)無限回の試行でも、当たるかどうかわからない. となります。無限回の試行なんて出来っこないので、   e)実行可能な現実の試行回数では、あきらめたら?. となり、確率0の表現は妥当だと思うのですが、それでも、   f)初回でx=aにまぐれ当たりするケースを、否定はしません.  次に事象が起きるかどうかの判定ですが、確率空間を定義するためには、その母集団Xを指定する必要があります。Xは、疑問の余地なく具体的に指定しなければなりません。そうでなければ、確率空間の定義など不可能です。そして、   ・a∈Xなら、x=aは起こり得る.   ・a∈Xでないなら、x=aは起こり得ない. になる気がするんですが・・・。よって、a∈Xなら、まぐれ当たりする確率0でも起こりえる・・・。  安易すぎますか?・・・(^^;)。じつはビュッフォンの針問題で、似た状況にぶつかったもので・・・。

noname#152584
質問者

お礼

ありがとうございました。

noname#152584
質問者

補足

質問内容は連続的な確率変数を前提にしています。有限個しか値を持たない場合については確率0の事象を最初から排除して考えても支障ないので。

noname#175206
noname#175206
回答No.3

 連続、あるいは無限個から一つ選ぶ確率は、通常は0とされますね。  もっとも厳密には、その無限の濃度を問うこともあるようですが(0~1が有理数か実数か等々)、一つ(あるいは有限個)を選ぶ確率が0ということは変わりません。  有限個(離散となる)であれば、確率が0というのは「起こりえない」です。  しかし、無限個から一つ選ぶことは、どれに対しても「起こり得ます」ので、有限個から選ぶときのような概念が成立しません。  しかし起こり得る確率0という表現を嫌って、どんな小さい正の数よりも小さい「無限小」の確率と表現することもあるようです。

noname#152584
質問者

お礼

ありがとうございました。

  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.2

理論的には、 P(X=a)=0 なら、X=aとなる可能性は全くありません。 たとえば、普通のサイコロを振って出る目の数が0、や10、-1、3.5などになる確率は、0で、このような目が出ることも全くありません。 「世間一般の感覚では、確率=0というと可能性が全くないと認識されている」ので正しいです。 もし、確率=0なのにそれが実現されたとすれば、なにかの間違いということです。読み間違いとか、混入とかです。 「確率が非常に小さいから、実現されることはない」ということであれば、それは正しくない。実現される可能性はある、ということですが、いつ実現されるかわからないし、永久に実現されないかもしれない。確率は、それについての情報は持っていません。

noname#152584
質問者

お礼

ありがとうございました。

noname#152584
質問者

補足

根元事象全体の集合Ωの部分集合Aについて、Aの確率P(A)が定義されるときに「Aが発生する可能性がある」、P(A)=0のときにAの確率が0、という意味で可能性という言葉をここでは使っています。

  • foomufoomu
  • ベストアンサー率36% (1018/2761)
回答No.1

>X=aとなる可能性がないとはいえませんよね? 現実世界では、数値表現の精度があるため、X=aになることは、けっこう多いです。 たとえば、全校生徒に、今使っている鉛筆の長さをノギス(精度0.05mm)で測ってもらって、結果が123.45mmという数字になる確率は、新品の鉛筆の長さが150mmなら、およそ1/3000で出てくるわけです。 こういう状況を考えない(かぎりなく高精度で長さ測定が可能)なら、X=aとなる可能性はまったくないと言えます。

noname#152584
質問者

お礼

ありがとうございました。

noname#152584
質問者

補足

根元事象全体の集合Ωの部分集合Aについて、Aの確率P(A)が定義されるときに「Aが発生する可能性がある」、P(A)=0のときにAの確率が0、という意味で可能性という言葉をここでは使っています。

関連するQ&A

  • 平均が正規分布になる確率過程

    同じ分布に従う独立でない確率変数、X1,X2,・・・,Xn があるとします。この平均が正規分布に従うための十分条件、あるいは、必要十分条件には、どんなものがあるのでしょうか。もちろん n は、十分大きな値であるとします。 また、時間が連続の過程X(t)においては、平均が正規分布に従う十分条件、あるいは、必要十分条件はなんでしょうか。平均については十分長い時間の平均とします。 どちらの問題でも、とりうる値は離散的とします。(連続の場合もわかると嬉しいです) 定常状態を想定しています。

  • 確率・統計の問題です。

    以下の問題の解答をお願いします。事象Aの発生確率がpである試行を繰り返すとき、(x+1)回目にはじめて事象Aが発生する確率がある確率分布Pr{X = x}(x = 0, 1, 2, …)に従うとする。 (1)確率変数X, Yが独立で、それぞれがこの確率分布に従うとき、Pr{X + Y = k}を求めよ。 (2)確率分布Pr{X = x}(x = 0, 1, 2, …)のモーメント母関数m(t) = E[e^tX]を求めよ。

  • 「正規分布とパレート分布の裾確率の大小を比較をせよ」

    「正規分布とパレート分布の裾確率の大小を比較をせよ」 という課題で、密度関数等用いて計算していったところ x^(a-1) * e^(-x^2)   (x>0, a>0, e:ネピア数) でxを∞にしたときにどうなるのかというところまでたどり着きました。 当然後者のほうが強いので、ゼロに近づくことはわかるのですが、その証明方法がわかりません。 どなたか宜しくお願い致します。

  • 確率変数

    確立分布の離散型の例はポアソン分布や二項分布、連続型は正規分布とわかるのですが、確率変数の連続型と離散型の代表例を書けといわれれば、確率分布の代表例を書けばいいのですが。よろしくお願いします。

  • 確率統計

    確率変数Xが自由度14のカイ2乗分布に従うとき、次の値を求めなさい。     P(10.82≦X≦16.22) どう、答えまで導くかがわかりません。 正規分布ならわかるのですが・・・。 nS^2/σ^2の式を用いるのでしょうか?? 初歩的な質問ですみません。

  • 確率や正規分布が高校の授業に取り入れられたのはいつ

    高等学校の数学の授業で、今は次の(1)~(3)を学習すると思います。 (1)和事象の確率、積事象の確率 (2)連続的な確率変数 (3)正規分布 でも、自分が高校生だった頃(ン十年前です)には、このようなことは全く学習しませんでした。 (1)~(3)が高校の数学に取り入れられたのはいつなんでしょうか。 御存知の方がおられましたらお教えいただけないでしょうか。

  • 確率変数の式変形について

    Z(t)=√ρ*X(t)+√(1-ρ)*ε(t) X(t),ε(t) は互いに独立に標準正規分布に従う。 Z(t)<C の時に事象Aが発生する。 X(t)=x の下での事象Aの条件付発生確率を以下のように表す。 p(x)=Pr[Z<C | X(t)=x] =Pr[√ρ*x+√(1-ρ)*ε(t)<C] =Pr[ε(t) < (C-√ρ*x)/√(1-ρ)] =G[(C-√ρ*x)/√(1-ρ)]    ※Gは標準正規分布の分布関数 このときに、 E[p(x)]=∫[-∞~∞]p(x)f(x)dx   ※fは標準正規分布の密度関数 =G(C) ←★       1つ前の式から★に至る式変形がわかりません。 よろしくお願いします。

  • 確率の質問

    自分で考えた確率の問題なのですが、 解けずに困っています 「問題」 同じ連続確率分布f(x)に従う確率変数X1,X2,X3 がある。 確率変数Yを Y=Xi ( X1<X2<X3→Xi=X2, X3<X1<X2→Xi=X1, ... 真ん中の値をXiとする) とおくとき 確率変数Yの従う確率分布の平均と分散を求めなさい

  • 確率論の問題について

    (1)「確率変数Xが()(0,a)上の一様分布U(0,a)に従うとき、また()正規分布N(m,v)に従うとき、その標本化Zの分布密度関数を求めよ」 (2)「Xを標準正規分布N(0,1)に従う確率変数であるとする。Y=|X|の密度関数を求めよ。Yの平均と分散を求めよ」 というものなのですが(1)(2)ともにまったく手をつけることができません(泣)アドバイスなどお願いします(泣)

  • 確率 正規分布

    確率 正規分布 確率変数Xが正規分布N(5,2^2)に従う (1)P(6<=X<=9) (2)P(3<=X<=8) (3)P(X<=10) を求めよ という問題があるのですが、標準化変換のところがイマイチわかりません 調べたら 6=m+a 9=m+2a(mは平均、aを標準偏差としたとき) とかいてあるのですがそこからなぜ標準化変換したらP(0.5<=Z<=2)になるのかわかりません どなたかよろしくお願いします