• 締切済み

統計の質問です

統計の質問です。 EZRを使っています。名義変数と順序変数を使っての統計学的検討はどうやったらいいのでしょうか? 今までは名義変数同士での比較だったのですが、今回は名義変数、あるなしで、順序変数が生活習慣でうがいの励行で、段階として1.2.3.4に分けています。 この場合にうがいをきちんとしている、していないで人の疾病との関係を見たいのです。 どういう検討をしたらいいのか分かりません。

みんなの回答

  • 1026stat
  • ベストアンサー率100% (2/2)
回答No.2

データ解析環境「R」のEZRであれば、段階(1、2、3、4)の変数名がLevelであればfacter(Level)とすれば良いでしょう。 参考図書:すぐに役立つ統計のコツ(オーム社)

全文を見る
すると、全ての回答が全文表示されます。
  • snnnmdr
  • ベストアンサー率45% (21/46)
回答No.1

EZRというのは使ったことがないのですが・・ うがいの段階1,2,3,4をx軸に、疾病の段階をy軸にとって線形回帰分析すれば、うがいと病気の関係を統計的に分析できると思うのですがどうでしょう?

991karu
質問者

お礼

線形回帰分析ですか、手元の本によりますと一元配置分散分析に近いものの様ですね。連続変数を比較するための解析とありますが、こういう連続変数でないものも応用できるのかが分からないのです。 少し検討してみます。 また教えてください。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計学における「検定」とは?

    こんにちは、 今統計学について学んでいます。 そこで、統計に利用する変数の種類で、 名義尺度・順序尺度・間隔尺度・比尺度 などあります。 その中で、 参考書に出ていたのですが、 順序尺度は順序だけがついているもの、 正規分布しているかどうかわからない集団でも、 順位をつけて、より正確な「検定」ができる。 と書かれていました。 この「検定」とはどういう意味でしょうか? 後、日本語教育でこの分野を勉強しています。 その場合「変数」とはどういう意味で 使われているのでしょうか? あまりにも基礎で恥ずかしいですか、 統計自体が頭にはいってこなく、 混乱している状態です。 どうかアドバイスお願いいたします。

  • 検定方法を教えて!

    50以上の試料に対し、それぞれ、ある検査をして、3人の検査員が独立して「正常、軽度異常、高度異常、判定不能」と判定しました。この3人の判定結果に有意差が無いことを統計学的に証明したい。ところが「正常、軽度異常、高度異常」が順序変数なのに、「判定不能」はその順序から逸脱しており、名義変数の混在と思います。順序変数と名義変数が混在する多重比較検定法をご存じの方は是非ともご教授下さい。大変困っています。お願いします!

  • エクセルで統計 ~統計の基礎からわかりません~

    タイトルの通り、統計を知らない私が統計学的に証明しなければならない立場となりました。 今まで、エクセル-アドイン-分析ツール-基本統計量を利用してデータを見ることはありました。 以前「t検定?」やり方を聞いたことがあったのですが、何のためにやるのか理解していなかった私は、なんために、何を行ったのか?頭に残っていません。 ~データ~ 同一の母集団30名を検討します A群:生活指導なし1年後:腹囲変化(cm)2007→2008年比較 B群:生活指導あり1年後:腹囲変化(cm)2008→2009年比較 30名分の腹囲変化量を降順で並べ、グラフで比較すると B群に腹囲の増加抑制・減少効果があったように見えます。 このことを統計学的に「生活指導の効果」を検証したいです。 (1) 最初は30名の腹囲変化量から、増加・減少・不変の3群に分けて検証するのか?と思いました。だとしたら、どのように行えばいいのでしょう (2) その後、減少群の中には1cmの減少もあれば15cmの減少もある。これを1まとめに「減少」としていいのか?と素人的な疑問が出てきました。この疑問は解消せず、統計というものを行うのでしょうか? (3) かつ、30名は同一人物(年齢は違うけど)が引っかかってきました。   同一ではない母集団なら腹囲増減を降順で並べて、傾向をみることはありだと思うのですが、同一人物なので、一人一人の変化をみるべきなのでしょうか? と、悩み始めたら、結局何から手をつけていいのか分からなくなってきました。何かきっかけになれば…という思いで「質問」となりました。 最後まで読んでいただきましてありがとうございました。

  • 統計についての文を添削してください

    統計のことはぜんぜん理解していないものです。 どなたか私の文を添削していただけないでしょうか? 言葉遣いがおかしいとか、意味が違うとか指摘していただけると助かります。 サービスの品質改善というテーマで翻訳をしていたのですが、調査をおこないデータを整理して結論をだすために、統計の手法を使うことができる、という部分がでてきて困っています。 ネットでいろいろ学習??しましたが、あっているかどうかまったく自身がありません。 よろしくお願いいたします。 カイ二乗‐2つの変数の間での関連を決めるための統計技術。(1)観察されたデータが期待とマッチするかどうかを見る、(2)一方の変数の分布がもう一方の分布と関係があるかみる。 t-検定-サンプルが同じ人口から選べれているかを見るため、2つの個別サンプルの平均や割合を比較する統計技術。(3つ以上のサンプルの平均をテストするには、分散分析が使われます) 重回帰-複数の変数の値の変化によって、1つの変数の変化の値を予測するための統計技術です。 クラスタ分析-対象(学校/場所/物など)を特定された数の排他的グループ(内部的に同種)に分ける統計技術。 因子分析‐相関関係をもつ変数の大きなセットの要因を決める統計技術。 判別分析-人や物を2つ以上のカテゴリーに分類するための統計技術。 カイ二乗による相互作用の自動検出方法(CHAID)‐分岐方法を使って、因数のなかの相関と見つける統計技術。 以上です。

  • 「あり・なし」で回答できる変数の尺度分類は?

    統計学の勉強をしています。 変数の中でも例えば「離婚経験の有無」「自家用車所有の是非」と言った「あり・なし」「はい・いいえ」が回答となるものは、尺度分類(名義尺度・順序尺度・間隔尺度・比率尺度)のどれに該当するのでしょうか? 詳しい方にお力添え願います。

  • 統計危険因子を比較する場合の統計手法について

    統計に関する質問です。例えば、登校拒否かどうか(yes/no)をアウトカムとして、その危険因子(年齢、性別、家族構成、成績、いじめなど)の強さを比較する場合の統計手法としては、どのようなものが適するのでしょうか? ロジスティック・リグレッションモデルで、と思いましたが、例えば成績といじめは相互に関連がある可能性もあり、危険因子の各変数を独立して分析したい時に、これらの相互関係をどのように処理するかよくわかりません。或いは、他のモデルがよいのでしょうか? 基本的な質問ですみません。本を読んでいると混乱してよく分かりません。よろしくお願いします。

  • エクセル統計2012を使用した重回帰分析について

    統計に関する質問をさせていただきます。 わかる方がいらっしゃいましたら、ご教授願います。 エクセル統計2012を使用して重回帰分析をしようとしたのですが、意図していた結果が出ず悩んでいます。 分析したい内容は以下の通りです。 1月から12月までの各月の「イベント入場者数」は、「その地域の観光客数」「気温」「降水量」が関係しているか?についてです。 エクセル統計2012にて、 目的変数:イベント入場者数 従属変数:その地域の観光客数、気温、降水量 それぞれ入力し、変数選択を「増減法」としたところ、重相関係数Rは「0.0000」、回帰式に含まれる変数は「定数項」のみという結果が出ました。 今回ご質問したいのは、 1、上記のようなRが0という結果がありえるのでしょうか? 2、また、増減法ではなく「全変数」を選択して再度分析したところ、こちらはRが0.78という結果が出ましたが、「全変数」で出すべきなのでしょうか? 3、変数選択はどのように見分ければよいのでしょうか? 以上の3点についてお願いいたします。 よろしくお願いいたします。

  • 心理学のレポートの統計に関する質問です(><)!!

    私は心理学部に所属していて、卒業論文の分析方法が解らなくてとても困っています!!(><)解らないのは、友人関係満足感、5因子性格検査、コーピングの3つの質問紙の分析方法です。宜しくお願いします。 色んな分析方法を考えては、駄目だったり解らないことがあったりと、もうどうしたらいいのかわかりません(泣) 目的は、友人関係満足感の違いからみたパーソナリティ特性と対人ストレスコーピングの関連性について検討することです。 対象者には、友人関係満足感、5因子性格検査(パーソナリティ特性)、対人ストレスコーピングの3つの質問紙に回答してもらい、それぞれ得点化していきます。 (現在考えている)分析方法は、独立変数を5因子性格検査(5水準)と対人ストレスコーピング(3水準)。従属変数を友人関係満足感。2要因(5×3水準)の分散分析を5個(パーソナリティ特性の5因子)出して、5個を比較して考察していこうと考えています。 ここでわからないことは、(1)量的である独立変数の、5因子性格検査と対人ストレスコーピングをどうやって群に分けるか、 (2)質問紙の回答の件法(?)を揃えるべきか、 (3)分散分析以外の分析を用いるべきであるのか、その場合どの分析方法を用いれば良いのか、 です。 分析は、心理学の統計です。 どうか教えてください…(><。。)

  • 統計解析法に関して

    統計学に関しては全くの初心者です。現在、ある疾患の原因究明の研究に携わっています。具体的には、死後脳を使って候補遺伝子の発現量の違いを疾患群と健常者群とで比較検討を行います。そこで、データの解析法について御指導していただきたく存じます。論文など参考にするのですが、結果のみでそこにいきつくまでの考え方、解析の流れなどが判然といたしません。 得られた発現データと診断にてT検定を行うだけならクリアカットですが、死後脳を扱うために種々の影響を考えないといけないのではないかと思っています。実際、論文にはPMI(死後、脳摘出までの時間)、pH、死亡年齢などを考慮したように書いてあります。私の扱っているサンプルも調べてみると疾患群と健常者群でPMIなど有意な差があります。そのため、診断以外の変数が遺伝子の発現に影響している可能性を考える必要があるかと思います。素人なりに考えたのですが、それは重回帰分析をすればよろしいのでしょうか。それで発現量に影響を及ぼしている変数が見つかれば、それを共変量としてANCOVAを行う。発現量に影響を与える変数が見つからなければ、T検定もしくはOne-way ANOVAを行う。こういった考え方でよろしいでしょうか。統計ソフトはSTATISTICAを使う予定です。何卒、御指導の程よろしくお願いします。

  • 【統計】検定とその多重検定について

    はじめまして。これまで避けて避けてきた統計だったのですが、ついに勉強を、しかも猛烈な勢いでデータの分析をしなければならなくなりました。検定手法はデータがどういうものかによってその手法を選択するところまでは理解しました。その手法に基づき計算はPCでやり、それなりに結果が出てきたのですが、このデータは何を意味するのかがよく分かりません(読み方がわかりません)。 結果は下記のものでした。 Kruskal-Wallis検定: サンプル数=649, 統計量(H)=8.574 棄却率(p)= (10+1) / (1078+1) =0.0102 F=4.33, 自由度1=2, 自由度2=645, 棄却率(p)=0.0135 カイ二乗近似: 自由度=2, p=0.0137 N: 平均順位 1: 170: 303.0 2: 231: 353.4 3: 248: 313.6 多重比較 (Dunn): Q 2 = 3 : 2.325 : 0.1 > p > 0.05 2 > 1 : 2.662 : 0.05 > p > 0.02 3 = 1 : 0.566 : p > 0.5 平均を比較したのですが、  ・1群と3群の平均にはとくに関係なし  ・2群と3郡の平均にはとくに関係なし  ・2群と1群の平均には、どうやらなにか関係があって、   平均値は2群>1群といえるかも と判断しております。 超基本をすっ飛ばしご意見をいただこうとするのは大変申し訳ございませんが、何卒よろしくお願いいたします。