• 締切済み

正規分布しないデータの取り扱い

正規分布しないデータの取り扱い方法には 具体的にどのような手法があるのでしょうか? ちなみにネジの戻しトルクは正規分布するのですか? かなりの数量をサンプル取りしたのですが、 2元分布してしまって…

みんなの回答

noname#21649
noname#21649
回答No.3

>2元分布 の意味を知りませんので.とんちんかんな内容を書いている可能性があります。 1山分布の場合には.ノンパラメトリックという統計手法が使えます。 2山分布の場合には.サンプリングの間違いと解釈して.サンプリング条件を見直します。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>データの取り扱い の意味が不明確です。  集団が一つなら、代表値ということでしょうが、この場合は、平均値よりも中央値の方が適切でしょう。  2つの集団について、有意差の検定が目的で有れば、サンプル数は多いようなので、私なら順位差検定をします。  

  • 0shiete
  • ベストアンサー率30% (148/492)
回答No.1

グラフがふたこぶになっているのだと思いますが、 2つの要因が重なっているため、そのような結果になったのだと思います。 どちらか一方の要因を取り除けば、正規分布するのではないでしょうか?

関連するQ&A

  • 一方が正規分布と、もう片方は異なる分布の2つのデータがありまして、これ

    一方が正規分布と、もう片方は異なる分布の2つのデータがありまして、これらを比較してどのような傾向があるのかを調べたいのですが、どのような手法をとるのが好ましいでしょうか?

  • 正規分布

    研究を行っておりますが統計が難しくいつも悩みます。 2群間の比較を良く行いますが,基本的にはt検定を用います。 t検定を用いるには様々な条件が必要ですが,データが連続変数であり,正規分布であり,分散が等しいなどがあるようです。 そこでいつも悩む点が,正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか,本によって書き方が難解で解りません。 また,サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか。 教えてください。

  • エクセルで度数分布と正規分布を重ね合わせて表示する方法

    エクセルで度数分布と正規分布を重ね合わせて表示する方法 あるサンプルデータから求められる平均と標準偏差を用い、正規分布曲線をエクセルで作成することはできます。また、そのサンプルデータの度数分布を作成することもできます。エクセルでこの両者を重ね合わせて表示することはできるのでしょうか? グラフの種類>ユーザー設定>2軸上の折れ線と縦棒でやってもうまくできません。 ご存じの方がおられましたら、ご教示ください。

  • 「中心極限定理でサンプリング分布は元の分布の如何に関わらず正規分布に近

    「中心極限定理でサンプリング分布は元の分布の如何に関わらず正規分布に近づく」とあるのですが? 元の分布が右に偏った形をしていてもサンプリング分布は△←こういう正規分布になるんですか? それだとサンプルにならない気がするのですがいまいち意味がよくわかりません

  • 正規分布へのfitting

    ある実験データがあり、正規分布に近い形をしています。しかし近いとはいえ、少々ズレているため分散と平均値を求め正規分布の曲線を実験データに重ねて描くと、、、なぜか大幅にずれてます。原因は、平均から大きく離れたところにデータが少ないとはいえポツポツとあり、分散が大きくなるからです(平均値はほぼ正しい値と思われます)。 分散を求める際に正規分布おかまいなく求めるため過大になるのかと思い、正規分布にfittingしようと考えました。つまり最小二乗法により実験データに近い正規分布を求め、分散を求めるのです。 この方法は意味ありますか?おそらく太古の昔から用いられてるような誰でも思い付く方法と思いますが。。。また、実際に計算する場合、エクセル等で関数は用意されてますか?それともlogを取り2次関数に展開しfittingする必要がありますか?

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • 正規分布への変換について

    お世話になります。 現在計測しているデータの工程能力を計算しているのですが、 データの分布が正規分布していないように見られます。(N=30個) そこで、自然対数を取ると正規分布に近づくのですが、 なんの根拠もなしに自然対数を取っても良いものか 理解できていません。 ネットで検索しても正直よく理解できず、 噛み砕いた説明がある文献やサイトをご存じないでしょうか。 ちなみに、データはそれぞれ独立したワークから測定したものです。 自分なりに勉強し、正規分布の検証として ?測定データと期待値のグラフを作成  →直線状ではなさそうだが、どの程度のばらつきが許されるのか   わからず、判断がつかない。 ?ネットからD'Agostino-Pearson正規分布検定なるものを実施  →K^2 4.0、 p 0.13 正規分布の可能性がある。   値の意味は理解できていないのですが、   正規分布の可能性としては低めということだけは推測できました。 以上、どうぞよろしくお願いいたします。

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • 非正規分布のデータを評価する方法を知りたい

    ある施設で体力測定をしました。 正規分布をしていた項目は、そのまま分析して5段階評価しました。 正規分布していないデータは、どのようにして5段階に分けたらよいのでしょうか? 具体的には、42名に体力測定をし、開眼片足立ちと閉眼片足立ちが非正規分布になっていました。 開眼片足立ちは簡単だったようで、多くの人が最高値(120秒)まで記録したことと、閉眼片足立ちは難しすぎて、10秒以内で終える人が多かった一方で60秒以上こなす人もおられるのが原因です。 こういった場合の、統計的な5段階評価の方法を教えて下さい。 よろしくお願いします。

  • この場、正規分布ですか

    測定器Aで測定したデータ(データは一回しか取れない) 1mm 5mm 10mm 50mm 測定器BはAで測って1mmの物を30回測定結果は、N(1.1,0.2)の正規分布        Aで測って5mmの物を30回測定結果は、N(6,1)の正規分布        Aで測って10mmの物を30回測定結果は、N(9,2)の正規分布        Aで測って50mmの物を30回測定結果は、N(53,4)の正規分布 問題:Bで測った15mmの物は Aで測ったら何mmですか? 方法(1):Aで測ったデータをX軸にして、Bで測ったデータ各平均値でY座標にして、      得た4点で近似直線を作る、直線の式で問題を解ける(良くないと思う) 方法(2):(Bで測ったデータ-Aで測ったデータ)/Aで測ったデータ=m1 %       30回*4=120回 だからm1 % m2 % ・・・・m120 %--120個データ       この120個データは正規分布だったら、中央値5%とする 上記の問題も       解ける 質問は上記方法(2)の120個データは正規分布判断できますか(通常判断)