• ベストアンサー

統計学の課題ができてるか確認お願いします

1、ウェブより関係があると考えられる、地域に関わる2つのデータを各自選択し、エクセル形式で保存してください(もちろんエクセル形式で保存するのは、ウェブから得られるデータでなく印刷された出版物に掲載されたデータでもOKです)。 2、2つのデータをそれぞれ標準化しなさい。 3、2つのデータ間の共分散を求めなさい。 4、標準化した2つのデータ間の共分散を求めなさい。 5、一方のデータを説明変数、他方のデータを被説明変数とする回帰式と決定係数を求めなさい。また、被説明変数の理論値と残差を求めなさい。 このような課題が出たのですが、いちお私なりにやってみたのですが合っているか確認お願いします。 もし、間違っていたら教えてください。 このアップローダーの一番上の統計学にエクセルファイルをアップしました。よろしくお願いします。 http://gozmez.life.coocan.jp/uploader/uploader.cgi

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.2

> 3、2つのデータ間の共分散を求めなさいと4、標準化した2つのデータ間の共分散を求めなさいは具体的にはどのようにすればいいのですか 定義どおりに計算するだけです。 平均から偏差を計算し、偏差積和をデータ数(母集団の共分散を不偏推定したいならデータ数-1)で割るだけです。 標準化したデータは平均が0なので、偏差を計算する必要はありません。 また、標準化したデータの共分散は相関係数と一致します。

その他の回答 (1)

noname#227064
noname#227064
回答No.1

> このアップローダーの一番上の統計学にエクセルファイルをアップしました。よろしくお願いします。 なかなかアップローダーにアップされたものまで見る人はいないでしょうから、文字数制限等に引っかからなければテキストで書いてしまうか、質問事項を絞るかした方がいいと思います。 まあ、今回はつい開いてしまったので回答しましょう。 > 2、2つのデータをそれぞれ標準化しなさい。 標準化されていません。 > 3、2つのデータ間の共分散を求めなさい。 データ数で割る場合の共分散はあっています。 しかし、その下の数値は相関係数を求めたかったと思うのですが、「データ数-1」で割っている標準偏差と「データ数」で割っている共分散で計算しているため、正しい値が得られていません。 > 4、標準化した2つのデータ間の共分散を求めなさい。 2ができていないので、これも駄目です。 > 5、一方のデータを説明変数、他方のデータを被説明変数とする回帰式と決定係数を求めなさい。また、被説明変数の理論値と残差を求めなさい。 何を被説明変数に選んだかがわかりにくいですが、こちらは大丈夫です。

gouda1112
質問者

お礼

ご指摘ありがとうございます。 3、2つのデータ間の共分散を求めなさいと4、標準化した2つのデータ間の共分散を求めなさいは具体的にはどのようにすればいいのですか たとえば、  開業率 廃業率 開業率標準化 廃業率標準化 A 5.5   4.7   1.77    0.44 B 4.5   4.7   0.24    0.44 C 4   4.1   -0.52    -0.52 D 4.7   4.7   0.55     0.44

関連するQ&A

  • 統計学の課題で困っています

          A  B 北海道   5.5  4.7 青森    4.5  4.7 岩手    4   4.1 というA,B二つのデータがあるとき 1、2つのデータをそれぞれ標準化しなさい。 2、2つのデータ間の共分散を求めなさい。 3、標準化した2つのデータ間の共分散を求めなさい。 4、一方のデータを説明変数、他方のデータを被説明変数とする回帰式と決定係数を求めなさい。また、被説明変数の理論値と残差を求めなさい。 5、上記2及び4の計算結果について、標準化、共分散、相関係数の意味を説明しつつ、分析・考察を加えなさい。 6、回帰式を求める際の基本的考え方と決定係数の意味を説明しつつ、計算して得られた回帰式、決定係数について分析と考察を加えなさい。 7、残差において正または負の大きな値が出た地域について、なぜそのように大きな値が出たと考えられるか、地域の特徴を考慮しつつ思いつくことを述べなさい。 という課題が出された時どのようにして解けばいいのですか?

  • 最小二乗法について(統計学の回帰分析)

    「残差」と「回帰直線上の従属変数値から従属変数の平均値を引いた値」との共分散がゼロになるのは何故ですか?

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • ロジスティック回帰モデルでの多変量の外れ値の検討法

    ある多変量データ(説明変数x1, x2, x3(比例尺度)、 目的変数y(名義尺度で0,1で表される)、それぞれ10000個くらいのデータ)をロジスティック回帰モデルを使ってモデル化しようとしています。 SPSSやエクセル統計分析のソフトを使ってモデル化を行ったところ、変数の有意性については確認できたのですが、Hosmer-Lemeshow検定や相関値によってモデルの適合度を確認するとモデルが適合していないことがわかり、元の生データに外れ値が含まれていると考えております。 この外れ値を除去する方法がわからないため書きこませて頂きました。 重回帰分析の場合は、残差をその標準偏差で割って標準化したもの(標準残差または標準化残差)についてある閾値を設けて外れ値の判定を行えばよいと思うのですが、ロジスティック回帰分析についても同じやり方でよいでしょうか?ロジスティック関数を使用しているので、予測値と観測値の残差や標準偏差をそのまま使ってはいけないような気もしています。 詳しい方がいらっしゃいましたら、教えていただけると幸いです。また、説明が詳しいホームページなどがございましたら、併せて教えていただけると幸いです。どうぞよろしくお願い申し上げます。

  • 統計 課題

    統計の課題でどうしても解けない問題があって困っています。教えてください。 問題: 次の定理を証明しなさい X={x1~xn}のデータを、変数変換でもう一つのYのデータにすると 平均、分散、標準偏差が次のようになる。これを証明せよ。 平均    (Yの平均)={(Xの平均)-a}/b     a,bは定数 b≠0 分散    Sy2乗=Sx2乗/b2乗 標準偏差 Yj=(Xj-a)/b      (j=1・・・n) よろしくお願いします。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • 統計学についてお聞きしたいです.

    現在,統計ソフトRを使って,プログラムを書いています. 内容は多重共線性問題のあるデータを主成分回帰分析を使って,解決するということをやっています. データはRを使って,変数を数個を発生させ,その中の3つの変数を足すと0になるというデータを使っています.相関関係が高い場合のみの多重共線性のデータは自分のプログラムでうまくできたのですが,線形関係をつくると多重共線性のある変数が0に近づいてしまいます.実際は1に近づくはずなのですが.それがなぜだかが分かりません.どなたかご教授お願いします.線形関係の作り方は平均1, 分散0のデータを発生させ,そのデータをエクセルを使って,並び替えて作ります.その時データは平均1,分散0のままです.また,ヒントとなるようなプログラムやコマンドなどでも全然構いませんのでお願いします.今,3カ月かかってできません.本当に困っているのでお願いします.

  • EXCELの分析ツールの標準残差とは

    EXCELの分析ツールで回帰分析(一次回帰分析)をしますと、残差について標準残差というものが出てきます。数字を見ると残差の定数倍になっているようですが、これは何を計算しているのでしょうか?EXCELのヘルプを見ても出てまいりません。

  • 不均一分散の回帰分析に適した変数変換とは?

    不均一分散する変数について回帰分析をする場合、加重最小2乗法や変数変換等があるという情報をウエブで見つけました。 手持ちのデータ(独立変数が大きくなるほど、残差のばらつきが大きくなっているデータ)で試しに従属変数の対数変換をして回帰したら、確かに元の結果よりかなり鮮明な傾向が認められ、また分散もほぼ一定となっている様に見受けられたのですが、その様になる理由は、簡単にイメージ的に説明すると何なのでしょうか。 また上記の様に“綺麗な結果”になる場合、そのまま対数変換の手法を採用して回帰してしまって差し支えないでしょうか。似た様な曲線形をとる関数に平方根(y=√x)等もあると思うので、ひょっとしたら「平方根変換」等も選択肢としてはあり得るとも思うのですが…何故対数変換なのでしょうか。 やはり実際に使う以上、直感的イメージだけでもその手法の仕組みを理解したいので、ご教示頂けると非常に助かります。

  • 線形回帰分析:多重共線性と主成分回帰について

     最小二乗法による線形回帰モデルのあてはめについて,説明変数間に多重共線性がある場合,回帰係数の信頼性や予測精度が低下すると習いました.これを防止する方法として,元の説明変数行列の主成分を説明変数としてあてはめを行う主成分回帰(PCR)等があるようです.  しかし,説明変数行列の線形変換は,回帰モデルのあてはめ値(fitted values),残差,新たなデータに関する予測値に影響を与えません.主成分も線形変換の1つなので,元の説明変数と同数の主成分を説明変数に用いる場合,全く同じあてはめ値,残差,予測値が得られます. それでは,主成分回帰は何故,多重共線性による回帰係数の信頼性,予測精度の低下を防止する手段と言えるのでしょうか? (主成分回帰の狙いは,元の説明変数より少数の重要な主成分のみを説明変数に用いることにもあるようですが,これは,多重共線性の問題の防止とは関係ないと思います.) 勘違いしている点もあるかもしれないので,コメントを頂ければ嬉しいです。