• ベストアンサー

回帰分析です

ある論文を読まされています. 論文の中で回帰分析が用いられているのですが,「被説明変数が5%水準で有意に正」であるとなっているのですが,被説明変数名とサンプル数,AdjR2,B-P.het.test,F-statisticしか書かれていません. 説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005)だとは教わったのですが… 一体,被説明変数が5%水準で有意と何で判断してるのでしょう? 教えて下さい!

質問者が選んだベストアンサー

  • ベストアンサー
noname#6201
noname#6201
回答No.6

下の回答の補足です。 F(1,n-p-1) のp, n は p:変数の数 n:サンプル数 です。

emptyhead
質問者

お礼

ご丁寧にありがとうございます. F-値から間接的に有意さが判定できるのですね. 勉強になりました.

emptyhead
質問者

補足

皆さん,ご丁寧にありがとうございました. ポイントは2名様にしか発行できないので,ポイントが付かなかった方は御不満でしょうがご勘弁ください. また,次回によろしくお願いします.

その他の回答 (5)

  • selfer
  • ベストアンサー率76% (104/136)
回答No.5

重回帰分析の結果を 1)その変数が有効であるかの判定,どの程度有効であるかの指標 2)採用した変数全体のモデルが有効であるかの判定,どの程度有効であるかの指標 という観点でみるならば         有効かの判定   有効度の指標 変数レベル   t値(確率)   標準偏回帰係数(β) 全体レベル   F値(確率)   重相関係数(R),重決定係数(R2) とまとめることができます. さて,ここで問題になっているのは,説明変数の有効判定において「t値」が掲載されておらず,「確率」のみが直接掲載されていること,そのことが疑問に感じられているのでしょう. 勿論t値やF値が掲載されていた方がよいのですが,読者にとって重要なのは,その変数が結局有意水準レベルで有意であるかどうかの「結果」です. 確かにt値やF値,及び自由度が掲載されていれば,それらの数値から「○○%で有意であるかの判定」を自分で行うことができます(例えば,|t値|≧2,というのも自分で行う判定法の一種ですね).しかし,更に重要なのは,「結局」有意であったかどうか,その一点さえ載せておけばいいわけです. 具体的にt値=2.1,あるいはt値=10.3であったとしても,有意であったかどうかさえわかれば一応事足りるわけです.そのため,論文には,最小限の情報として確率,あるいは,有意判定の結果だけを載せており,その途中経過であるt値の数値を論文執筆者が載せていないだけなのです.

emptyhead
質問者

お礼

ありがとうございます. 端的且つ分かり易い説明で助かりました.

noname#6201
noname#6201
回答No.4

回帰係数の検定はt検定ですが、t分布とF分布の関係からF統計量で検定することもできます。提示されているF統計量に対して |F|>= F(1,n-p-1) なら回帰係数が0という仮説が棄却できる(つまりその説明変数を使う意味があると考えられる)。 > ただ、説明変数が8つもある、というのは多すぎる > のではという感じです。というのは、 何が影響す >るのか全体像がぼけるからです。 (略) >説明変数を3つもとれば、被説明 変数の変動の80% >以上は説明できるでしょうし、 経済などの場合では、少数の変数では寄与率が高くならないことはしばしばあります。 また、目的が少数の説明変数で予測することでなく、説明力の強さ(要因分析)であれば単純に変数選択で少数の説明変数で説明するのは本来の目的にかなってません。 #したがって、説明変数が8個はおかしくなくて、 #有意となった変数は説明力がほとんどないと判断します。 > 経済学の論文なのでサンプル数やR2の扱いは > 医療の統計とは異なるかもしれませんが. R^2などは領域には関係ありません。

emptyhead
質問者

お礼

なるほど,そう見ることも出きるのですか. しかし変数n,pは何でしょう?

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

重回帰分析では、どの説明変数を取り入れるかの判定をF検定でします。ですから、方法論としては、間違っていないという印象を受けます。その判断が正しいか否かは、筆者と論文の審査員を信じざるを得ないと思います。その過程を論文に書いても、冗長になるだけですから、書かないのではないでしょうか。  ただ、説明変数が8つもある、というのは多すぎるのではという感じです。というのは、何が影響するのか全体像がぼけるからです。何も考えずに、データをパソコンにぶち込んで力任せに無理やりやった、としか想えません。説明変数を3つもとれば、被説明変数の変動の80%以上は説明できるでしょうし、出来ないようでは解釈・説明が苦しいと想います。  それとも、単に予想が出来れば良いというものでしょうか。    エクセルではやったことはありませんが、統計ソフトだと、F値が出てきて、その値から、有意差が5%以下ならその説明変数を捨て、次のを入れたりして、回帰式を決めます。  その根拠は、私にはブラックボックスで、理解できていません。説明書に従ってやった経験はあります。平均寿命の説明変数として、医師数と看護婦数を取ると、看護婦数は少ない方が良い、というとんでもない結果がでて、「多重共線性」というやっかいなものにぶち当たりました。 >説明変数のT-statisticが|2|以上なら5%有意  これは、読んだことがありません。サンプル数によって有意差は影響されるので、正しいとは思えません。  ご自身で重回帰分析をなさったことがありますか。もしもまだでしたら、練習問題を統計ソフトを利用してなさるのが近道かと思いますが。  ほとんどお役に立たずにすみません。

emptyhead
質問者

補足

もしかして私の読み間違えのような気がしてきました. 被説明変数にT-staticsって無くてあたり前ではないですか? 説明変数には無くてはならないですが. B-P.het.testの値は被説明変数の個所に書かれていて,T-statisticは説明変数の個所に書かれています. これで問題ないんですよね. ちなみに説明変数が8つあってF-statisticは40以上,AdjR2も約0.9です. 経済学の論文なのでサンプル数やR2の扱いは医療の統計とは異なるかもしれませんが. サンプル数で有意さが影響されるという事は勉強になりました.

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 回帰分析とあるですが、単回帰ですか、それとも重回帰分析ですか。  単回帰分析は、サンプル数と相関係数から、t検定で有意差を検定します。  説明変数が複数の重回帰分析では、その説明変数を取り入れるか捨てるかの判定を、F検定でしていたような記憶があります。それには、増加法、減少法、増減法の3つがあったように、おぼろげに・・・。 重回帰分析は、解釈が難しいので、やらないことにしています。 >AdjR2,B-P.het.test,F-statistic この部分が訳せれば、OKということでしょうか。 AdjR2は、標準化した相関係数(R2だったら、決定係数) B-P.het.testは、Back-Progressだったら、増減法 F-statisticは、F検定をした、というのが想像です。当たるも八卦、というところで、占いにしてすみません。 >説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005) ここも分かりません。これも、重回帰分析の話でしょうか。

emptyhead
質問者

補足

重回帰分析です. 説明変数は8あります. AdjR2はEXCELを使った場合,「自由度調整済みR2」と表示されるヤツですね. F-statisticはF値. B-P.het.testはBreusch-Pagan検定らしいのですが… >説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005) は説明変数のT値が絶対値で2以上ならP値で0.05以下と見なす事が出来るという意味です. (0.005は0.05の誤りでした)

  • 0shiete
  • ベストアンサー率30% (148/492)
回答No.1

下記参考URLをごらんください。 疑問に思っていらっしゃることはこういうことではないですか?

参考URL:
http://oshiete1.goo.ne.jp/kotaeru.php3?q=457582
emptyhead
質問者

補足

残念ながら違います. T-statisticsが分かっていれば困らないのですが,サンプル数,AdjR2,B-P.het.test,F-statisticしか無いから困ってるのです(T-T)

関連するQ&A

  • か回帰分析についてです。

    こんにちは。重回帰分析について質問があります。Excelの分析ツールで回帰を行いました。回帰式をA=α+β1×変数1+β2×変数2+β3×変数3としたとき、Aが有意水準5%(P値)以内となっています。このとき、β1~β3のT値が、5%以内ならAに関係かある変数になりますが、例えば、Aを5%変動させても、変数1~変数3には、影響がないと言えますか?

  • エクセルの回帰分析について

     エクセルで回帰分析をおこなったのですが、有意な結果がでませんでした。説明変数がすべてダミー変数であるからでしょうか?ダミー変数のみで回帰分析を行うことは可能ですか?

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • 単回帰分析の結果(説明)の書き方

    単回帰分析を行うと、次のような結果が出ました。 r = 0.93, 自由度4, 5%有意水準 (0.811)より有意(1%有意水準 (0.917)でも有意) ta = -2.71, 自由度4,  5%有意水準 (2.776)より有意ではない tb = 5.13, 自由度4,  5%有意水準 (2.776)より有意(1%有意水準 (4.604)でも有意) 上記のような結果が出た場合 (1) ta(t値の切片)は、5%有意水準よりも小さいため、有意ではありませんでした。 5%有意水準で有意でなければ、次に10%有意水準を調べて表示して書いたほうが良いでしょうか? (2) rは、xとyの間に因果関係のある非常に高い正の相関関係がある。 rとtb(t値のx値)は、1%有意水準で有意である。 ta(t値の切片)は、5%有意水準でも有意ではない。 このような場合、どのようにして文章に書けば良いのでしょうか? よろしくお願いします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 【エクセル2010での回帰分析】

    現在エクセルでの回帰分析に取り組んでいるのですが、おかしな結果になってしまいます。 原因がわかる方いらっしゃいましたら、ご教授いただけないでしょうか。 回帰分析は説明変数2つ、ダミー変数5つ、観測数466で行っています。 添付画像のように、 概要のうち、一つの変数の係数・標準誤差が0、tが65535、P-値が#NUM!になってしまい、 その一つ下の行の変数が、P-値が同様に#NUM!になってしまいます。 また、説明変数とダミー変数の種類・数を変えて回帰分析を行うと、変数の数が多いときに、この現象(変数のうち一つが係数・標準誤差・t・P-値がおかしな値になり、その下の行の変数のP-値が#NUM!になる)が生じます。 このような場合 どういった原因が考えられ、対策としてはなにが必要でしょうか? よろしくお願いいたします。

  • 回帰分析について教えてください

    統計に関する質問です。 私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。 具体的には下記の通りです。 【状況】 ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。 データは5年間分をパネルとして扱っており、総数は400くらいです。 2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。 エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。 その後、回帰分析を行い、分散分析表を作成しました。 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。 【私の主張】 私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、 (なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。) 【ご質問】 1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。 2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。 抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。 【前提】 上記は私の職務柄、個人で利用する目的で作業を行っています。 論文その他レポートの作成を目的としておりません。

  • 重回帰分析のモデル式の解釈についてご教授ください。

    社会学関係の論文をいくつか読んでいると、重回帰分析の結果として、 ・調整済R^2が5%~10% ・モデル式に関してのF検定は0.01%~0.1%で有意 ・いくつかの説明変数に関してのt検定は0.01%~0.1%で有意 というような重回帰モデルをいくつも見かけます。 私自身、統計学を勉強中で解釈に困っているのですが、 この重回帰のモデルの解釈としては、 「(1)予測においては、目的変数の変動はほとんど説明できておらず、このモデルを使って予測してもほとんど当たらんが、目的変数に影響を与えているいくつかの説明変数の効果がゼロではない。また、目的変数と説明変数との間の影響関係を見ることにおいて、その目的変数に影響を与えるだろう説明変数を明らかにできた」というようなところでしょうか。 よろしくお願いします。

  • 回帰分析の示す結果について

    論文を読んでいてどうしても分からない点があったので、質問させてください。 回帰分析の一種と思われるのですが、説明変数となるべきデータがある基準に基づいてランク分けされており、このランクを説明変数とした解析が行われています。 この解析の結果に、 p 値と共に T に上付きの ÷ がついた記号と、 T に 上付きの - がついた記号で表される数値が併記されていました(T^÷=○という表記です)。この数値は何を示しているのでしょうか。なお、r の値は示されていませんでした。 説明不足の点がありましたらご指摘ください。よろしくお願いいたします。