• 締切済み

連続数値を説明変数とする分散分析 ~Rにて~

もしかしたら馬鹿げた質問かもしれません。。 分散分析の際に、連続数値を説明変数とする方法はないでしょうか? 例図のような連続する数値の流れがある成績に対して有意に影響しているかどうかを調べたいのです(これらの近似式はあります)。 できればRで解析したいと考えています。 ご教授のほどどうぞよろしくお願いいたします。

みんなの回答

回答No.1

ライブラリmgcvを使ってノンパラメトリック・スプライン回帰をやればいいです。 関数gamで予測し、summaryを見れば、それぞれの項のP値が出てきます。 でも、近似式がもうあるのなら、その標準編回帰係数で影響度は分かるのでは?

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 共分散分析に関して。

    通常,高低群に分けたものを独立変数とし,平均値の差を知りたい変数を従属変数とした場合には,t検定でも分散分析でも同じ値が算出するかと思うのですが,そこに共変量の影響を仮定した場合には共分散分析が検定力を強め,有意差が異なってくるのではないかと考えました。 そこで,SPSSの「一般線形」「1変量」で共変量をすべて投入して分析を行ったんですが結果をどう見ればいいのかよく分かりません。また,共変量の投入が妥当なのかも疑問です。そこで,どういった場合に共分散分析を行えて,またそれが妥当なのか,ご教授いただけると嬉しいです。 ちなみに,分散分析を行う際に影響を及ぼすと思われる共変量は,性別や年齢,職種など全部で5つあります。これを全部一括して投入するのか,もしくは1つづつ投入するのか,それとも分散分析が妥当なのか,よろしくお願い致します。

  • 連続型確率変数の分散

    離散型確率変数の分散の式はイメージもつかめ理解できるのですが、連続型確率変数の分散(被積分関数)が、なぜああいう形になるのかわかりません。教えて下さい。

  • 共分散分析(ANCOVA)で困っています

    共分散分析(ANCOVA)で分からない点があり困っています.  疫学研究系の国内誌に投稿したところ,査読者から,共分散分析のモデルについて再考すべしとの指摘がありました.  要因A(体操教室の参加者,不参加者)が従属変数Y(握力の強さ:連続変数)に及ぼす影響について,共変量X(年齢,性別,教育年数,喫煙)を投入した共分散分析のモデルにより検討しようとしています.  そこで質問です:  ・質問(1) 共変量Xは,従属変数Yとじっさいに有意な相関関係にあるものしかモデルに投入できないのでしょうか?    ・質問(2) 共変量Xのうち,要因Aと相関関係に有るもの,要因Aと相関関係に無いものの両方を混在させてモデルをつくることは妥当なのでしょうか?  ・質問(3) 査読者から,共分散分析を実施する上での前提を確認することとの指摘がありました.共分散分析を実施するうえで必ずチェックしなければいけない点について分かりやすく教えてください.  以上について,お教えいただければ幸いです.

  • 分散分析について

    当方、添付してある数値で朝・昼・夜それぞれで飼い主と供試猫に有意差があるか調べたいのですが、分散分析の何を使えばいいのでしょうか?一元でしょうか? またその場合、どこからどこを選択すればいいのでしょうか? Excel2010のデータ分析ツールを使用しています。

  • 重回帰分析と分散分析

    R≒0のとき、p値が有意であることは何を意味していますか 分散分析の帰無仮説は全ての係数が0であるですが、 Rがゼロに近いとき、p値が有意になることはありますか 持っているデータで回帰分析を行ったところ R=0.11xx、R2=0.012xx、P<0.001xx となりました。これは、相関がないことを示しているのでしょうか。 それとも弱いながらも相関があることを示しているのでしょうか。 よろしくお願いします。

  • 共分散構造分析における変数の使い方

    統計に関して全然稚拙な私ですがどうかご教授ください。 現在修士論文で共分散構造分析を使おうとしています。 先行研究を参考にしたモデルを多母集団同時分析をしようと しています。 統計に関してはホントにわからないことだらけで、いくつか 質問があります。 先行研究の潜在変数は4つに設定されています。 一つ目は4項目、2つ目は2項目の観測変数からなる潜在変数で ここまでは問題ないのですが、他の2つは「24項目6因子」 と「24項目5因子」の尺度を用いています。 この6因子と5因子のそれぞれの合成変数を観測変数として 扱って2つの潜在変数を作っています。 私としては合成変数として扱うと個々の項目の影響力がわからなく なるので「この方法論はどうなんだろう?」と疑問符でした。 この方法論をどのように考えますか? また6因子・5因子のままAMOSを使って共分散構造分析をしよう とすると「6因子・5因子のそれぞれは関係は、無相関でなければ なりません」という警告がでます。 これはどういった意味なのでしょうか?違う尺度の項目で作られた 因子なのですが、それぞれ共分散のパスを引くべきでしょうか? 意味のわからない質問かもしれませんが、何卒ご教授ください。 お願いいたします。

  • 二つの項目の関係の有意差を求めたいのですが・・・

    二つの項目の関係の有意差を求めたいのですが・・・ ある要因を与えることで成長にどのような影響があるのか、という実験をしました。 要因のあるグループとないグループで縦軸に身長、横軸に体重の散布図から(近似式の?)有意差があるか求めよ、ということなのですがこのような場合どうすればよいのでしょうか? ヒントとして(答えでしょうか?)t検定、共分散分析とは言われているのですが、探せど二つ以上のファクター(?)がある場合の解析がわからないのです。 統計はまったくわからなくて困っています; できればエクセルで分析ツール以外のやり方のやり方を教えてください。

  • 分散分析が使えない条件?

    古生物学の研究で産出した対象とした範囲の時代で 化石の形態に時代によって違いがあるか?というテーマで卒論をやっています。 各時代で20~百数十個体の化石の殻について各パーツを測定して それぞれの測定値やその比について分散分析を行いました。 4つの時代すべてで分散分析を行ったうえで有意差がでたものについて 各時代ごとに(各群といえばいいでしょうか?) 2群ごとに分散分析を行いました。 質問は このような場合に分散分析を使っていいのか? なにか分散分析を使っていけない条件に当てはまっていないか? です。 2群間の比較に分散分析を使っていいのか?とか。 測定値は間隔比率変数で各群の間に対応関係は無く 正規分布になるという点もクリアしています。 何冊か統計学の本もよんでインターネットでもいろいろ 調べたのでおそらく大丈夫と思うのですが 見落としている点があると怖いので質問させていただきました。 本当に分散分析をつかえるのか?と聞かれて、「たぶん大丈夫、、、」としか答えられなかったので。 まわりに統計が分かる人がおらず、分かりそうな 先生方も捕まらなかったので 分かる方お願いします。

  • 回帰分析と分散分析

    多変量解析の本を読んでおります。 記述に違和感(誤植)があったので、質問させていただきました。 疑問点は、回帰分析と分散分析のページ(p.111)です。以下原文より引用。  有意Fに書かれた値が0.05より小さくなる場合には、5%の確率でしか起こらないようなことが起こったとして、帰無仮説を否定します。この場合、「帰無仮説」は、「回帰分析があてはまらない」でしたから、これを否定するということは「回帰分析があてはまる」となります(厳密には「回帰分析が当てはまらないことはない」)。  有意Fに書かれた値が0.05より小さくなる場合には、「回帰分析が当てはまらない」という帰無仮説は採択されます。  このような検定の考え方で、有意Fの欄の値をαとするとき、 α>0.05 回帰直線は却下 α<0.05 回帰直線は採用  質問は2段落目の「有意Fに書かれた値が0.05より小さくなる場合には、「回帰分析が当てはまらない」という帰無仮説は採択されます。」の「帰無仮説は採択されます」の部分です。これは、「帰無仮説は棄却されます」ではないでしょうか。つまり、有意Fが0.05より小さい場合は、帰無仮説を棄却して、対立仮説を採択するという判断をするのではないでしょうか。私の考え方は間違っていますか。 出版社の訂正表にはこの部分に関しての訂正はありませんでした。 よろしくお願いします。 引用 意味がわかる多変量解析 石井俊全 ベレ出版 2014

  • 分散分析で有意差が確認された場合、データの水準を解析範囲から外して再解析を行うことは駄目ですか?

    統計初心者の一人です。ご指導宜しくお願いします。基本的な質問で恐縮ですが、2元配置の分散分析で有意差が確認された場合、他と異なるデータの水準を解析範囲から外して再解析を行うことは統計上問題ですか? 分散統計で要因の一つを操作因子、もう一つは濃度因子にした2元配置の分散分析を行なっております。その結果、操作因子並びに濃度因子共に「有意差」が確認されました。 このため、元のデータの範囲設定を変更し、影響のありそうな操作因子や濃度水準を分散分析の計算範囲から除外して再計算を行なってみました。そうしたところ「有意差ありとはいえない」との結果が得られました。当然、信頼限界を計算してそれから有意な濃度範囲を求めることも行っています。 この結果をもとに報告書に実験の操作要因と影響する濃度の範囲として考察に加えようと考えていますが、この考えは統計的な観点からは邪道な考えでしょうか?もともと実験計画はR.Aフッシャーの3原則の一つである実験番号の割り当ての無作為化(ランダムに実験番号を割り付ける)が基本であるので、この様な解析はその考え方から逸脱するため意味を持たないかとも思っていますが、本当に駄目なのでしょうか? 理由を含めご教授願いたく宜しくお願い致します。レベルを下げて具体的にご教授願えれば幸いです。 <例> Data 水準-1 水準-2 水準-3 SampleA n=1 24 24 22 n=2 25 24 22 n=3 25 24 22 SampleB n=1 25 24 22 n=2 25 25 25 n=3 25 25 25 SampleC n=1 21 20 17 n=2 21 20 17 n=3 21 20 17 分散分析・・・Sample間(濃度)、水準間(条件)で有意水準5%で有意差あり →ここで、濃度、水準がどの範囲まで影響しているかを確認するために、下記のよ うにデータ範囲を変更して再解析 Data 水準-1 水準-2 SampleA n=1 24 24 n=2 25 24 n=3 25 24 SampleB n=1 25 24 n=2 25 25 n=3 25 25 分散分析 有意差なし 以上です。