• ベストアンサー

線形変換

データを線形変換したときに、不偏な統計量は標準偏差、2群の平均値のt値、変動係数、ピアソン相関係数のどれになるのでしょうか?(答えは二つあります) 大変申し訳ありませんがどなたか教えていただくことはできますか。 宜しくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.2

もう一つ補足して欲しかったのですが、まあ、それは置くとして。 とりあえず、線形変換すると平均と標準偏差がどうなるかを示しておきます。 X_1~X_nのデータを X'_i = aX_i + b と線形変換するとします。 まず線形変換前の平均は m = ΣX_i / n 線形変換後の平均は m' = ΣX'_i / n = Σ(aX_i + b) / n = (aΣX_i + nb) / n = am + b 次に線形変換前の標準偏差は s = √{Σ(X_i - m)^2 / n} 線形変換後の標準偏差は s' = √{Σ(X'_i - m')^2 / n} = √{Σ(aX_i + b - am - b)^2 / n} = |a|√{Σ(X_i - m)^2 / n} = |a|s となり、標準偏差は不変でないことがわかりました。 あとの三つはこれを理解していれば簡単なはずです。 うっかりしていましたが、ANo.1の > どちらか一方だとは思いますが…… は間違いですね。 両方変換しないと駄目でした。 あと、2群の平均値のt値は絶対値記号付きの方ですね。

その他の回答 (1)

noname#227064
noname#227064
回答No.1

不偏ではなく不変の間違いではないですか? (線形変換しても統計量の値が変わらないのはどれかという問題) 2群の平均値のt値とピアソン相関係数はどちらも二変数ありますが、線形変換するのはどちらか一方のみですか? 答えが二つということなので、どちらか一方だとは思いますが……

Chirolu_yumi
質問者

お礼

ご回答ありがとうございました。そして申し訳ありません、不変の間違いです・・。 ご指摘の通り統計量がかわらないのはどれか、という問題です。 線形変換(定数倍と定数足し算)したとき、不変な統計量はどれかという問題ですが、、ご質問の答えになっているでしょうか・・・? 基本的な知識がなく申し訳ありませんが、教えていただけたら幸いです。

関連するQ&A

  • ピアソンの積率相関係数は不偏推定量ですか?

    こんにちは。 ピアソンの積率相関係数は,母相関係数の不偏推定量ですか? あと,このことに関する文献があれば教えてください。 よろしくお願いします。

  • 統計学について

    統計学の無相関検定について 無相関検定について理解ができておらず、 どなたか教えてください。 理解できていない場所を理解したいので、 非常にまとまりがありませんが、箇条書きとしました。 番号ごとに箇条書きしたので、 番号に対応するように回答を頂けると幸いです。 よろしくお願いします。 (1)無相関検定により、帰無仮説が採択されると、相関係数の数値の大小に関係なく、一律で統計結果自体を無効にする。 (2)統計結果自体の無効とは、すなわち相関係数ゼロのことを指す。 (3)相関係数ゼロとは、すなわち無相関のことを指す。 (4)「相関の強さ」と「有意」は別個の考え方である。 (5)「相関が強いこと」=「相関係数が1または-1に近いこと」である。 (6)相関が強い場合でも、有意でない場合は、「統計自体が無効だった」ということになる。 言い換えれば、「統計結果は無相関だった」という解釈になるのだろうか? (7)相関が弱い場合で、かつ有意である場合は、「弱い相関があった」ということになる。 (8)「統計自体が無効だったこと」=無相関なのか? (9)「相関の強さが弱過ぎる」=無相関なのか? (10)相関があるという仮説の数は無限であり、相関が無いという仮説の数は1つである。 11.相関係数がゼロであることは、無相関検定をやること以外の方法では生じない。 つまり、変数が2つのとき「偏差積の平均÷標準偏差X÷標準偏差Y」の計算結果によって、相関係数がゼロという答えが出ることはない。(無相関検定をやる前から無相関であるという答えが導き出されることはない) 非常にまとまりが無くて申し訳ありませんが、よろしくお願いします!

  • 統計科学における共分散について質問です

    おはようございます。 自分で考えたのですが、参考資料を教官が指定していないために、非常に理解できません。皆様の力をお借りしたく記載します。   1.変数XとYの分散はそれぞれ2と8で、共分散は3であるとする。 (1)3Xの標準偏差を求めよ (2)-yの分散を求めよ (3)2x-yの標準偏差を求めよ (4)ーxと-2yの共分散を求めよ (5)xとyの相関係数を求めよ   自分で答えを出したのですが (1)2√2 (2)8 (3)0 (4)不明 (5)0.75   続いて 2.変数sとtについて次の観測値があるとする  s -5,1,3、-1、-7  t -1,2,5、-7,11 (1)sの標本分散を求めよ (2)tの不偏分散を求めよ (3)sとtの不偏共分散を求めよ (4)sとtの相関係数を求めよ   これも自分で算出しました (1)16 (2)45 (3)???? (4)   ここで質問です。共分散の式がわからないのです。 ノートを見てもどの公式を使えばいいのか不明で 予想としては、2.(3)の答えは  (-6*-3+0*0+2*3+-2*-9+6*9)÷5=19.2 で (4)の答えが 19.2÷√20÷√45=計算してません。   となると思うのですが、正解でしょか? 大変申し訳ないのですが、お答えいただければ幸いです。

  • 相関係数と標準偏差

    相関係数と標準偏差 相関係数の分母がなぜ標準偏差になるのかわかりません。 なぜ平均や分散ではだめなのでしょうか。 数学の初心者にもわかりやすい解説をいただけるとうれしいです。

  • 相関係数について

    相関係数(ピアソンの積率相関係数)のp値とは何ですか? 文献の解釈をする上で、このことが分からなくて困っています。統計学の本などを調べてみたのですが、分かりませんでした。回答お願いします。

  • 自然対数に変換する意味がわかりません

    ある化学分析の本に、2組の時系列データについて、変動パターンの相関係数を求めるのに、移動平均との比(×100)を自然対数に変換して相関係数を求める、との説明がありました。こういう場合、自然対数に変換するのにどういう意味があるのでしょうか?

  • 平均値・不偏分散などの公式

    こんにちは。 文系大学の1年生です。 パソコンの授業で、ワードの数式エディタを練習する課題が出されました。数式エディタそのものはちゃんと使えるのですが、課題として出された公式がわからず困っています。。。 出された公式は、 ・平均値 ・不偏分散 ・標本標準偏差と母標準偏差 ・標準誤差 ・変動係数 の5つです。なんのこっちゃわかりません・・・ 調べてみたのですが、例えば平均値にしても、なんだかたくさん「~平均」という公式があって、おそらくどの公式も一般的なものでいいと思うのですが、どれが一般的なものなのかもわからず・・・ どなたかわかるかたはいますか? よろしくおねがいします。

  • 統計学の練習問題 解説が理解できないので…

    統計学の練習問題を解きたいのですが、解説が理解できないので教えてください。 「世帯数が約10万の市でn世帯を無作為に抽出して各世帯の人数を調べて市の人口を推定する。 推定量の変動係数を5%以下にするためには 抽出する世帯数nはおおよそいくら必要か。 ただし母集団の変動係数は1.0以下であることがわかっている。」 解説には 「世帯数を推定するのに推定量の分散が最大となる場合、つまり母集団の変動係数が1.0である場合を考えて、この場合でも推定量の変動係数が5%以下になるように標本サイズを定めればよい。標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。これが5%以下になるためには、標本サイズは(1/0.05)^2=400以上あればよい。」 と書いてあります。 理解できないのは、 『標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。』 この部分です。 変動係数=標準偏差/平均値 標準誤差=標準偏差/√n というのは調べました。 どうして『』のような流れになるのでしょうか? 教えてください。よろしくお願いします。

  • 変動係数

    標準偏差÷平均=変動係数ですが 平均÷標準偏差=? すみません。教えてください

  • 質/量混在のグラフィカルモデリングについて

    グラフィカルモデリングを用いて、変数間の関連を調べています。 対象データに質的変量と量的変量が混在している為、  量・量=相関係数(ピアソンの積率相関係数)  質・量=相関比  質・質=独立係数(クラメール連関係数)   を、それぞれ使用して相関行列を作成しました。 (15変数) このようにして(半ば)強引に作成した相関行列から偏相関係数行列を作成し、共分散選択により偏相関係数を0においていく手法を行なってしまって良いのでしょうか? そもそも、量・質データが混在した状態でのGMは無理なのでしょうか? (質的データのみであれば「グラフィカル対数線形モデリング」というものがあるようですが、難しくて。。。) ちなみに、質的データは2値の(1/0)ダミー変数に置き換えたものを使用しており、同一カテゴリ内のダミー変数は1つだけ使用するようにしています。 何処かで2値(1/0)の質的データの独立係数は、それを量的変量と置いた場合のピアソンの積率相関係数と一致する、というのを見かけた記憶がありますが。。。 あまり関係ないでしょうか?