レアな現象の確率・発生時間間隔について

このQ&Aのポイント
  • 梅雨の時期には100年に1回ほどの大規模な降水量が生じます。
  • 過去30年のデータから年最大降水量と確率の関係を整理し、特定の降水量や発生確率を求めることができます。
  • 確率分布の仮定と確率データの算出方法には恣意性が混入する可能性がありますが、経験的な選択や理論的な根拠に基づいて行われることが多いです。
回答を見る
  • ベストアンサー

レアな現象が発生する確率・発生時間間隔について

梅雨の時期ですが、100年に1回ぐらいに生じる大規模な降水量(1時間降水量mm/h)がどれくらいになるかという問題があります。 例えば、年最大降水量(mm/h)について過去30年間のデータを取得したとします。つまりデータは30個あり、順番に並んでいるとします。 1位 80mm/h 2位 75mm/h 3位 62mm/h ........... 30位 42mm/h おそらく確率分布とか確率密度関数を仮定し、データに応じたパラメータ設定を行い、年最大降水量(mm/h)⇔確率の関係を整理して、ある確率(例えば100年に1回、すなわち1/100=0.01)の値に応じた降水量を求めたり、ある降水量に対する発生確率(時間間隔の逆数)が求まったりするわけですね。パラメータ同定には最小自乗法とかを使うのだろうと思います。(違うかも知れません。ご指摘ください。) そうしますと、とにかく確率と降水量のデータを作成する必要があります。ここで質問ですが、30年間で最大の降水量の確率は1/30=0.033で良いのでしょうか。2位は2/30, 3位は3/30,....ということです。 何故だか分かりませんが、確率データの算出は上記のような単純なもの(1/30,2/30...)使用する確率分布関数(あるいは確率密度関数)によって決まっていたのではないでしょうか。そのような気がするのです。いわゆる順序確率といわれる分野になるのではないかと思いますが...。 包括的な質問になりますが、このような確率的な問題を考える上で確率分布の仮定とそれに応じた確率データの算出法というプロセスで恣意性が混入することはないのでしょうか。確率分布の選択というところは”経験的によくあう”、だったり、理論的にそのようになるはずであるとの説明もあると思いますが。これは仕方ないかも知れません。それ以外にどうしてそうするのだろうという疑問は一切ないということになるでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • masa2211
  • ベストアンサー率43% (178/411)
回答No.5

>現実と合致しているというのは具体的にはどのような量においてなのでしょうか。 この意味ですが、 1.正規分布と対数正規分布(あるいは、ポアソン分布...)でどれに一致しているか 2.対数正規分布と極値分布、上下限値付き分布でどれに一致しているか (上下限値付き分布(正式名称は何だったかな?忘れた。):たとえば正規分布で確率ゼロとなるのは、σ=±∞のとき  ですが、有限でゼロになるように裾の部分を補正した曲線のこと。) により、やり方が異なります。 1.の場合。 度数分布曲線(要するに、データ全体)から判断します。 具体的には、正規分布と仮定した場合、降雨量にマイナスはありえない(要するに下限値がある。)し、 また、度数分布は左側に偏った山となる(大抵の観測地点ではそうなる。)ので、 明らかに正規分布とはみなせません。 2.の場合。 これは、度数分布曲線を描いても、あまりにも曲線が似すぎているため判断不可能です。 ですから、技術的判断が伴う(=人により見解が異なる可能性がある)ことになりますが.... ​http://www.qsr.mlit.go.jp/osumi/sivsc/home/specialist/item1/01-05.htm の図1.6のようなグラフ(確率紙)を使います。 この場合、対数確率紙を使っているので、雨量データが対数正規分布なら 測定値は直線上に並びます。(理論式は直線です。) 対数正規分布以外なら、理論式は曲線になります。  ※プロッティングポジション公式に何を使うかの問題はあるが.... で、対数確率紙に、直線および各種の仮定分布の結果の曲線を描いてみて、 どれが現実(=測定値)に合っているかを判断します。  ※ガンベル分布用の確率紙も存在します。 で、現実問題として、確率曲線の裾の部分(確率の低い部分)までが 全体傾向に合っている保証はありません。 よって、 ・裾の部分だけを合わせれば良しとする。大雨量10個程度だけのデータをもとに直線回帰する。 ・直線回帰でなく、曲線アリなら全体が合うはず。(岩井法、石原高瀬法) といった手法となります。 >例えば現実の平均的な降水量のようなところでしょうか。それとも >10年に一度(1/10)程度のレベルでの理論カーブとデータ一致性でしょうか。 平均的な降水量とは、確率50%の点を意味するから、どんな分布を想定してもあまりかわりばえしません。 (ポアソン分布とか正規分布まで視野にいれる場合、この限りではない。ポアソン分布や正規分布にならないのは確定的です。) ですから、裾の部分だけを合わせるというような技術的判断もアリです。 裾の部分だけを合わせるというのは、実質的には >10年に一度(1/10)程度のレベルでの理論カーブとデータ一致性 と同じことです。

その他の回答 (4)

  • masa2211
  • ベストアンサー率43% (178/411)
回答No.4

>30年間で最大の降水量の確率は1/30=0.033で良いのでしょうか。 プロッティングポジション公式を言われるものです。 1/30(カリフォルニア法)でもかまいませんが、1/31(分母に1を足す。トーマスプロット)または 1/30(分母を2倍し、分子は1,3,5,7.....。ハーゼンプロット)が使われます。 >恣意性の混入....どうしてそうするのだろうという疑問 どうしてそうするのかは、現実と合っているからとしか言いようがありません。 少なくとも、現実と合っていないものを選ぶのはおかしいです。 ただ、「現実と合う可能性があるもの」には複数の可能性があり、統計データという性格上、仕方ないです。 恣意的はどうかは別にして、計算手法を変えればどのくらい変わるかというと、 http://www.qsr.mlit.go.jp/osumi/sivsc/home/specialist/item1/01-05.htm ここには、同じデータで、 岩井法、対数正規(トーマス)、対数正規(ハーゼン)、石原高瀬、ガンベルの 4方法で計算した例があります。

hoso1093
質問者

お礼

回答有難うございました。 現実と合致しているということですね。現実と合致しているというのは具体的にはどのような量においてなのでしょうか。 例えば現実の平均的な降水量のようなところでしょうか。それとも10年に一度(1/10)程度のレベルでの理論カーブとデータ一致性でしょうか。 本当の勝負は1/100ぐらいなので実はまだまだ発生した事例がないレベル(あるいは1,2回発生?)程度であり、合っているという意味もまた良く分からないのではないかと思うですが。

  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.3

No.1 の考え方でいけば、100 年に一度の降水量を求めるためには、 過去 100 年の降水量を調べて、その最大値を取ってくればよい… ということになります。身も蓋もありませんが、 主観の入り込む余地もありません。 > サンプル30個をとったら、そのひとつが30000回に1度の頻度で > しか生じないようなものだった …ようなケースを考えるには、31 個目のデータに関しては、 そのようなケースが生じたという条件での条件付確率分布で考える 必要があります。それが不可能ならば、1/30000 だけを部分的に 持ちだしても、意味をなさない。 その条件付確率分布を考えるには、データの分布について、 観測されたデータから解ること意外に、何らかの仮定を置かねば ならないでしょう。実りある結論は、洞察ある仮定から生ずる… という訳です。それが、「経験的によくあう」の世界ですね。

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 同じ確率分布に従う互いに独立なサンプル30個をとったら、そのひとつが30000回に1度の頻度でしか生じないようなものだった、という場合を考えますと、31個目のサンプルが1位になる確率は「上記のような単純なもの」で計算した答である1/31には到底及ばないでしょう。  さて、果たして本当に「30000回に1度」のサンプルなのかどうかは確率分布を(推定して)決めないと言えないし、さらにその確率分布が不変であるという仮定、サンプルが独立だという仮定も必要になる。これらの仮定が本質的に重要という訳ですが、でもいずれも疑う余地がある訳で、かくて疑問だらけということになりそうです。

  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.1

既に得られている 30 個のデータと これから測定する 31 個目のデータが、 共通の確率分布に、独立に従っているとすれば、31 個目のデータが順位 n 位になる確率は、 n の値によらず 1/31 です。 これは、各データが独立であれば、 分布関数には依りません。 そういう話?

hoso1093
質問者

お礼

回答有難うございます。そういう話です。 私が見ている資料に ”ワイブル分布(k=1.5)に従う有限個の極値データの場合、未超過確率P(H<Xm,N)=1-(m-α)/(N+β) k=1.5の場合α=β=0.42" とあります。単純に順番でなくて、分布型に依存したプロッティングポジション公式?になっているのです。これ何?と思案しているところなのです。これが質問の発端です。

関連するQ&A

  • 確率密度関数に関する問題。

    超基礎問題なのですが理解できません… ご教授よろしくお願いします。 (1)確率変数Xの密度関数が f(x)=1/2,-1<x<1 0,その他の場合 であるとする。 このときXの平均、分散を求めよ。 (2)Xは標準正規分布N(0,1)に従う確率変数であるとする。下の問いに答えよ。 (a)Xの確率密度関数を書け。 (b)X^2の確率密度関数を求めよ。 (3)X,Yは独立な確率変数であり、Xはパラメータλ1のポアソン分布Po(λ1)に従い また、Yはパラメータλ2のポアソン分布Po(λ2)に従うとする。 このときX+Yの確率分布を求めよ。

  • 確率密度関数の問題

    以下の、確率密度関数を求める問題がよくわかりません。 詳しい解説をお願いします。 Xはパラメータλの指数分布に従う確率変数とする。以下の確率変数について、その確率密度関数を求めよ。 (1) B = e^X (2) C = (1+ X)^-1 (3) D = (1+ X)^-2 よろしくお願いします。

  • 天気予報の雨量表現は?

    天気予報の雨量表現が今一不明です。 (1)「雨量○○mm」とあるのは総雨量?     つまり降り始めから終わるまでの降水量mmの事でしょうか? (2)単に「○○mm/H」とあるのは雨量密度?     つまりその率での降水があると言う事? (3)TVやラジオで普通聴く「○○mm」と言うのは上記(1)でしょうか?

  • 確率統計

    ◆ 確率分布とパラメータ:指数分布 λ>0 確率・確率密度関数P(X=x)またはPx(x):{Px(x)=λe^(-λx) (x>0) , Px(x)=0 (その他)} 特性関数 φx(jt):(1-jt/λ)^(-1) 平均値 E[X]:1/λ 分散 Var[X]:1/(λ^2) ◆ 確率分布とパラメータ:幾何分布 0<p<1 確率・確率密度関数P(X=x)またはPx(x):Px(X=x)=pq^x, x=1,2,・・・ q=1-p 特性関数 φx(jt):p/(1-qe^(jt)) 平均値 E[X]:q/p 分散 Var[X]:q/(p^2) ◆ 確率分布とパラメータ:負の2項分布 r=1,2,・・・, 0<p<1 確率・確率密度関数P(X=x)またはPx(x):Px(X=x)=【r+x-1,x】(p^r)(q^x) , x=0,1,2,・・・ q=1-p 特性関数 φx(jt):{p/1-qe^(jt)}^r 平均値 E[X]:rq/p 分散 Var[X]:rq/p^2 これらの確率分布について、(1)連続確率変数と離散確率変数のどちらか、(2)全体の確率P(-∞<X<∞)=1となることを計算せよ、(3)これらの確率変数について、平均E(X)と分散 V(x)が求められることを計算せよ。 ってところがわかりません。よろしくお願いします。

  • 確率論の密度関数

    Xがパラメーターλの指数分布に従うとき、(1)A=2X+5(2)B=e*X(3)C=1/1+Xの確率変数の分布の密度関数を求めたいのですがどのようにしたらいいのかわかりません!アドバイスお願いします(泣)

  • 連続と離散の確率分布の関数について

    確率変数が連続量(実数)の場合と離散量(例:サイコロ)の場合があります。 連続型の確率分布の場合、確率密度を例えば∞からaまで積分したものを確率分布P(a)としているのではないでしょうか。連続量ですから微分とか積分となじみます。 一方で離散量(例:サイコロ)では、変数と言っても1,2,3,4,5,6しかありません。、確率分布は1/6の等分布です。離散量ですから微分もできず、そういう意味で確率密度関数もないようなのですが、確率質量関数というものがあるようです。これは昔からあるものでしょうか。テキストには載っていないようです。確率の説明では常にサイコロを用いた離散量での説明が教科書に載っています。そのため確率質量関数は出てきておかしくないのにあまりなじみがないように感じています。これは昔からずっとあるものでしょうか。

  • 確率の問題

    確率の問題 X~N( 0 , 1 )のとき、Xの平方 Y = X ^ 2 の分布関数を考える。以下の問いに答えよ。なお、N( 0 , 1 )の分布関数をΦ(x)、確率密度関数をφ(x)で表す。 (φ(x) = 1/(√2π) exp{ - x^2/2 } 、-∞ < x < ∞) (1)Yの分布関数FY(y)をΦ(・)を使って表してください (2)Yの確率密度関数fy(y)をφ(・)を使って表してください。また、fy(y)を具体的に求めてください。 確率の問題で、よろしくお願いします。

  • 確率密度関数は常にないの?

    確率分布関数があって確率密度関数がない場合とはどうのような場合でしょうか? 超関数の範囲であっても確率分布関数が微分できないことがあるのでしょうか? 有りそうな気がしますが例示するのは難しいのでしょうか? よろしくお願いします

  • 確率の問題です。

    どれか一つだけでもいいので回答よろしくお願いします。 問1, Xを幾何分布Ge(p)にしたがって分布する確率変数、Lを自然数とするとき Y = min (Χ, L) の分布を求めよ。 問2, パラメータαをもつ指数分布の分布関数は F(x) = 0 (x<0), F(x) = 1-e^(-αx) (0≧x) で与えられる。 a , b > 0とするとき以下の確率を求めよ。 (1)P(X≧ a/2) (2)P(X> a + 2b\X > a) 問3, 確率変数Xの確率密度関数が f(x) = sinx , 0≦x≦π/2 で与えられるとき、P(X≦π/3)を求めよ。

  • 確率の問題です。

    どれか一つだけでもいいので回答よろしくお願いします。 問1, Xを幾何分布Ge(p)にしたがって分布する確率変数、Lを自然数とするとき Y = min (Χ, L) の分布を求めよ。 問2, パラメータαをもつ指数分布の分布関数は F(x) = 0 (x<0), F(x) = 1-e^(-αx) (x≧0) で与えられる。 a , b > 0とするとき以下の確率を求めよ。 (1)P(X≧ a/2) (2)P(X> a + 2b\X > a) 問3, 確率変数Xの確率密度関数が f(x) = sinx , 0≦x≦π/2 で与えられるとき、P(X≦π/3)を求めよ。