• 締切済み

統計学(分布図の近似??)

2つの異なる数値データから得られた分布図を、どちらか一方の分布図の形に近づけたいのですが、何か良い方法はありますか? 例えば、異なる2つの数値データ群から得られた、円形の分布図と三角形の分布図があるとします。 この時、三角形の分布図が円形の分布図の形に近くなれば、三角形の分布図の数値データを円形の数値データに近づけることが出来ると思うのですが、何か良い方法をお持ちの方はよろしくお願いします。 目的は、三角形の数値データ群を円形の数値データ群に近づけることです。 その一手法として、この方法を考えたのですが、他に良い方法があるという方もよろしくお願いします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 国語の成績と算数の成績を比較するときには、平均点が違っていたりするので、標準化という作業をして、両方とも正規分布化します。偏差値がこの例です。  この標準化を応用すれば、可能だと思います。A集団は国語と算数で散布図を描き、B集団は理科と社会で散布図を描く場合も、算数、国語、理科、社会のすべてを標準化してから散布図を描けば、同様の散布図になるハズ。 ただし、「(2)の図形というのは、(1)のデータの平均・標準偏差のみから作成」が理解できていません。私の印象は、『統計学の使い方を何か勘違いされているのでは』です。

kahe0803
質問者

お礼

再度回答ありがとうございます。 問題としていることをうまく説明できず申し訳ありません。 別の言い回しでもう一つ同じ内容の質問を掲載しているので、もしお時間があるようなら見ていただけると有り難いです。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

分布の異なるものを、正規分布のようにする方法に標準化という手法があります。その典型例が、入試などの偏差値です。 >三角形の分布図が円形の分布図 データは、一次元で、ヒストグラムで表すことが多いのです。多くの人についての身長と体重の図のように、二次元ということでしょうか。  気になるのは、三角形という分布図。こんなものは、一般的ではなく、何か作為が入っているのでは。作為が入っていると、科学ではありません。 >近づけることです 統計の多くは、検定です。これは、異なることを主張したい、ということです。  近づける、なんぞは・・・。換算する、くらいしか思いつきませんが。

kahe0803
質問者

お礼

ご回答ありがとうございます。 これが統計学なのか数学なのか自分でもよく分かりませんが、三角形や円形など不適切な表現をしてすいませんでした。 言い直すと(1)の図形を(2)の図形(理想型)に近づけるための変換方法が悩みです。 (2)の図形というのは、(1)のデータの平均・標準偏差のみから作成したものです。 再度、御教授いただければ幸いです。

関連するQ&A

  • 一方が正規分布と、もう片方は異なる分布の2つのデータがありまして、これ

    一方が正規分布と、もう片方は異なる分布の2つのデータがありまして、これらを比較してどのような傾向があるのかを調べたいのですが、どのような手法をとるのが好ましいでしょうか?

  • 統計学 正規分布と対数正規分布の比較方法

    統計学についての質問です。 比較使用としている群で、ひとつの群は正規分布( Shapiro-WilkのW検定、p<0.05)で、もう一つの群が対数正規分布(KolmogorovのD検定)となりました。この二群間にて数値の有意差を検定するときの検定方法は正規分布の二群間と同じようにt検定等といったパラメトリックな検定を用いて問題ないのでしょうか? また、正規分布と対数正規分布の二群を検定する検定方法はどのような方法が望ましいのでしょうか。 対数正規分布は標本数8検体で、正規分布のものは3検体~12検体となっています。

  • 統計 正規分布図がなんかおかしい 

    マンホイットニーのu検定をしているのですが、 正規分布と主な信頼区間?(グラフ上に凸の2時関数みないな図です)をつくったのですが、 平均0、標準偏差1で作ると、ちゃんとそうなるのですが、 実験データの平均32、標準偏差9.522ですると貼り付けのようになります。(壊滅的な絵で申し訳ないです・・) これは、どうしたものなんでしょうか・・・? 参考にさせていただいたのはhttp://software.ssri.co.jp/statweb2/tips/tips_2.htmlです。 こちらを見て作らせていただきました。

  • 添付した図のように分布を推定するには

    添付した図のような散布図に対して,黒線のように近似曲線を推定し,かつ, それを基に赤線のように各年(x軸)にどれだけデータがばらついているかを表現したい のです。(添付図はペイントで自分で書いています) 単純に2次近似の曲線を推定する(黒線のみ)のは可能なのですが,推定した分布で赤線の 推定をする方法が分かりません。 このような分布推定方法をご教示ください。 なお,エクセルでやりたいと考えています。

  • EXCELグラフ〔分布図〕で【y=a】などを表現するには

    EXCELグラフ〔分布図〕で2点をプロットし、近似曲線を利用して自動的に関数(y=ax+b)を表示できるようにしています。 【例えば】 x=2|4 Y=4|8 という表を分布図にて数式表示すると【y=2x】となります。 ここで例えば、x=3,y=6という地点を強調するために、x軸に向けて垂線を下ろしたいのですが何か良い手はありますでしょうか? 【x=3】という直線を引けばよいのですが、このひきかたがわかりません。【y=6】などは引けるのですが・・・ 【x=3】を引くための元データ(表)はどのような形になるのでしょうか? ちなみに、出来たグラフに図形[直線]を挿入するのは反則です。元データの数値を入れ替えてもグラフが完全連動するようにしたいので、単純に[直線]を挿入する方法ではデータが変わったときにずれてしまいますので。

  • EXCELにて分布図

    今EXCELにて分布表を作っていますが行き詰ってしまいました。 作っている表は企業分析にて格付毎に振り分け、格付毎に売買差益を出しました。 分かりにくい書き方かもしれませんが、表としてはどちらでも構いませんが、X軸に格付でY軸に売買差益です。 分布表な感じで作りたいと思いますがそんな表は出来ますか?完成しましたら、格付も低くて売買差益もあまり出ていないような会社とは取引を控えるようにするかどうか・・・な感じです。 データとしては会社名・売上高・売買差益・格付があります。 他に例として挙げるなら、テストにて年齢別でどのあたりの点数が集中しているかの分布図です。 分かりにくい質問で申し訳ございませんが宜しくお願いします。

  • 統計手法選択の根拠

    医療系の論文を読んでいて思ったことです。 統計の手法に関して、なぜその手法を選択したのかが書かれていないのが通常のようです。 たとえば2群の数値データの有意差を求めるのに複数の手法がありますが、なぜ選択の理由を書く必要がないのでしょうか。

  • 統計について

    統計に関する質問です。 音響特徴量 (データ数:10 以下A群と呼ぶ) 脳波 (データ数:5 以下B群と呼ぶ) 感情価測定尺度(データ数:6 以下C群と呼ぶ) 一時的気分尺度(データ数:6 以下D群と呼ぶ) 質問1 A群とそれぞれの他群(B群、C群、D群)の関連性を分析し、音響特徴量が持つ感情価・心理的影響を調査したいと考えています。データ数が異なるグループ間での関連性を分析する適切な方法は何でしょうか? 質問2 B群、C群、D群と被験者の背景情報(年齢、性別など データ数:6)との関連性も分析したいのですが、分析が複雑化する可能性があることから、省略した方が良いでしょうか? 質問3 A群のデータの組み合わせが持つ相互作用についても調査したいと思います。この目的に適した分析手法を教えてください。 何卒よろしくお願いいたします。

  • 受験者が10000人のある試験について、得点別の度数分布を調べたら図の

    受験者が10000人のある試験について、得点別の度数分布を調べたら図のようになった。 この結果を累積度数分布(得点の低いほうから順に、各得点ごとの人数を累積した値の分布)で表わした時、その形に近いものはどれか。 添付画像が粗くて申し訳ないですが、中央上の画像が問題の図です。 x軸は得点で、Y軸は人数になります。 右下の画像が正解の図なのですが、左下の画像との違いがよく分かりません。 考え方を教えてください。 よろしくお願いします。

  • 正規分布しないデータの取り扱い

    正規分布しないデータの取り扱い方法には 具体的にどのような手法があるのでしょうか? ちなみにネジの戻しトルクは正規分布するのですか? かなりの数量をサンプル取りしたのですが、 2元分布してしまって…