• ベストアンサー
  • 困ってます

統計解析法は残差分析でいいのか?

ある疾病の年度ごとの発生率を統計解析にかけてレポートを作成しようと考えているのですがどの統計解析法を使って良いのかがわかりません。 手元にあるデータとしては一年毎の全患者数と統計にかけたい疾病の疾病例数です。また年ごとのサンプル数はかなり幅があります。 単純に疾病例数を全患者数で除算しものを発生率としてグラフにしてみますと減少傾向にあるようにみえます。 これを統計解析にかけてある疾病の発生率が減っていると証明することはできるのでしょうか? 10年分のデータがあるとして 全患者数、疾病例数の2マス×10年分10マスとして残差分析にかけていいものなのでしょうか? そもそも残差分析なる物がどういうものか理解できていないのですが・・・ また別のデータとしてその疾病に効果があると考えられる薬剤の一年毎の出荷数なるものがありますがどのような統計処理を行えばよいのでしょうか? 全く統計は素人で申しわけありませんがよろしくお願いします。

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数423
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2
  • kgu-2
  • ベストアンサー率49% (787/1592)

 事情は、分ったつもりです。もしも、私の書き込みが研究の進行に有効な場合は、共同研究を要求することができますし、そうでない場合は謝辞を期待するのは、当然だと考えています。しかし、このトピでは顔が見えないので不可能です。従って、「課題はダメ」なんぞの規約がありますが、学術に関した質問は、「課題はダメ」の規定よりも大きな問題を含んでいる、すなわち、学問的な謝辞に類するマナーに必ず違反する、という事実を理解して下さい。 私は、謝辞を要求しているわけではありません。事実、サンプルを測定の依頼に対してでも、「私の名は連名にしないでよい、まあ謝辞はお願いします」と話をつけてから、とりかかります。謝辞を書かないと、レフリーの「測定法は」との質問に、「依頼した」と返事したときに、依頼先の名が書かれていないようだと、マナー違反で、その人の研究姿勢が笑われます。  まず、残差分析なんぞは知りませんので、そんな低レベルの者です。  回答は、その指導教員に失礼になる、謝辞は横に置いておく、の為に、以下はあくまで独り言。独り言を周囲の人が聞いてしまうの仕方がない。 >減少傾向にあるようにみえます。  これは、普通、グラフでそのように見えれば、誰も異論は唱えません。統計学的な処理をする人は見たことがないのですが、回帰分析をすれば、見た目ではなく、科学的に主張できます。  横軸に年度、縦軸に症例数なり、有病率なりをとれはよい。縦軸が何がよいかですが、分母は、患者数が最適、とは言えないかと。PMIと似ていますが、PMIは、年齢調整死亡率が使えない場合の代用です。  あとは、相関係数から有意差検定をすれば、統計学的な判定ができます。決定係数から、論文だと、もう一行かけますが、ご自分で勉強して下さい。  この場合の弱点は、年度が原因とはならないので、時代を変えると同じようなグラフにはならないこと。すなわち、因果関係成立の5要件(7要件とか9要件という人も)の一つである普遍性(一致性とも)を満たしていないであろうこと。これを擬相関といいます。  減少を「有意である」と主張できても、それはこの期間限定の話です。 >その普及率が上がったからそれに効果のある疾病が減少したと言えないものかと考えています。  因果関係、ですから、相関分析をする。  横軸に原因と推定される年度ごとの普及率、縦軸に有病率などの結果。散布図を描き、もっともらしい線(直線とは限らない)が引けそうなら、パソコンで相関係数を計算し、有意差を判定する。  因果関係の判定が必要なので、5要件でチェック。教科書には、密接性の要件では、「強固な関係があること」なんぞと文章ではご立派ですが、実際には強固か否かの判定法はいてないので、現実にはどうしようもない。  有意差の有無が不明なのに、5要件を詳述しても無意味でしょう。5要件で行き詰ったら、また質問して下されば、独り言をつぶやくかも。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

遅くなりましたが何とかなりました。 ありがとうございます。

関連するQ&A

  • 残差分析についての質問です。(初心者)

    心理学の学生で調査系のゼミに今秋から配属になりました。早速、残差分析について調べることになったのですが、なかなか初心者向けの本に残差分析が載っておらず、理解にてこずっています。 インターネットのサイトも調べてみたのですが、理論は載っていても、どのような手順を踏んで値を求めるのかまでは見つけるに至りませんでした。ちなみに手元にある資料は田中敏先生の「実践データー解析」です。 お勧めの本や、残差分析についての紹介のあるサイトをご存知の方がいらっしゃいましたら、ご紹介いただけないでしょうか?宜しくお願いいたします。

  • 統計解析について

    統計解析について勉強中です。 薬剤A投与患者100人、薬剤B投与患者80人、薬剤C投与患者70人、薬剤D投与患者40人の血圧を投与前、1時間後、3時間後と測定して薬剤による血圧の降下を検証しようと思っています。 AだけならAと一つの薬剤投与患者群に注目し、t検定にて「薬剤Aで血圧の降下がみられる or みられない」の検証は可能かと思うのですが・・・ 一番知りたいのは、薬剤A~D投与患者群を比較して「○○の薬剤投与患者群が最も血圧降下がみられる」や「△△は□□に比べ血圧降下がみられる」ということを検証できるかということです。 最初に書いていますとおり、各薬剤投与患者の対象人数はバラバラです。 まったくの素人ですので、よければご鞭撻お願いします。

  • 大気汚染を統計解析を使って分析したい

     今研究で大気汚染について調べています。そこでNOX,OX、SPMなどのデータを統計解析などを使って分析したいと思っていますが、何を使ってよいのかいまいち分かりません。  そこで、参考になる本やHPなどがありましたら、どなたか教えてください。宜しくお願いします。

その他の回答 (1)

  • 回答No.1
  • kgu-2
  • ベストアンサー率49% (787/1592)

1)学生さんの研究だと、指導者に訊く、こと。 2)全く個人の研究、会社などでの発表なら、アドバイスに対する謝意をどのように表現されるのか。論文や学会なら、謝辞はマナーです。 3)もしも、誰もいない、個人的な趣味なら、その旨を書いて下さい。個人の趣味とは違うようですが。 >単純に疾病例数を全患者数で除算しものを発生率として 有病率に近い印象があります。私なら有病率にしますが。 何故かは、お考えください。 >これを統計解析にかけてある疾病の発生率が減っていると証明することはできるのでしょうか? 簡単にできます。ただ、グラフで明確に見えるなら。明確でない場合は、解析すれば可能。あれば、減少を統計学的に「減少」と主張できますが、なくても「減少していない」という結論は導けません。 >薬剤の一年毎の出荷数なるものがありますがどのような統計処理を行えばよいのでしょうか?  お金があるので、なにかをしたい、という質問とレベルが同じです。何をしたいのか、旅行なのか、食事なのか、寄付したいのか、目的を明確にしない限り、回答は不能です。  患者に関する薬剤の効果、なんぞは、難しい。なにより、薬剤は厚生労働省に許可されるときに、有効性は明示されているので、なにを今更、と感じます。  何をなさりたいのか、明確にして下さい。

共感・感謝の気持ちを伝えよう!

質問者からの補足

 わけのわからない質問にわざわざ回答ありがとうございます。 個人が特定されるのが怖くて自分の素性をまったく書いておりませんで申しわけありません。 ある生命科学系の大学に在籍しております。なので今回の相談の内容も対象はヒトではなくて動物です。 所属研究室の教授にも相談しているのですがどの解析法を使っていいのかわからず困っています。  薬剤の件ですが質問が日本語になっていなくて申しわけありません。あせっていたためはしょりすぎました。 その薬剤に問題としている疾病の感染予防効果があるのは確実で、その普及率が上がったからそれに効果のある疾病が減少したと言えないものかと考えています。 実際の出荷数は毎年ばらつきがあるものの少しずつ増加傾向にあるように見えます。 ただ、対象の動物自体の飼育頭数が毎年減少傾向にあるので母集団が減ったから有病率も減ったのか?それとも薬剤が普及したから有病率が減ったのか? が論点になるかなと思っています。 エクセルではじめる統計学など基礎の基礎の本を呼んでいるのですがどうして良いのかわかりません。 なにとぞアドバイスをよろしくお願い致します。

関連するQ&A

  • 統計解析法の選択について

    統計初心者でまだまだ勉強を始めたばかりです。 エクセル統計を購入したのですが、3つの疾病でそれぞれのあるデータ(血液データなどの数値)の平均値の差の検定、 またそのデータを異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい場合、 後者は独立性の検定(χ2検定)でよいのでしょうか。前者に関しては何が最もよいかわかりません。 初歩的な質問で申し訳ありません。周りに相談できる人がいなく質問させていただきました。 よろしくお願い致します。

  • エクセル統計での単変量解析の仕方

    エクセル統計(2010)での単変量解析の仕方を教えていただきたくメールしています。 まず、現在特定の疾患に罹患した患者の情報を、後ろ向きにある薬剤の併用群と非併用群とで病気の悪化までの期間、および生存期間にどう影響しているのかを検討する研究を行っています。  使用している薬剤の使用状況や患者背景などたくさんの因子が病気悪化や生存に影響していると考えられるため、多変量解析をしていくのが最も有用と思われますが、その前に、患者背景(年齢、性別、前治療歴など)の雑多な因子を単変量解析にて検討して多重共線性を解析した上でCox比例ハザードモデルで多変量解析したいと思っています。  そこで、最初のふるいわけをする単変量解析のやり方がよくわからず、エクセル統計2010を使用した場合、どのように開始していくのか教えていただければ幸いです。各調査項目に関してハザード比、95%CI、検定結果(p値)として標記したいと思っています。  よろしくお願いします。   

  • 統計、主成分分析について

     すいません。  勉強中の身なのですが、まだあまり理解度は低いと思われます。  統計学の主成分分析なのですが、  分析内容は  「グループ毎のデータを用意し、そのデータからグループ毎の違いを導き出すことができるか。つまりデータ→グループ分けをして元のグループのようになるか。」  で正しいでしょうか?    例えば、プロ野球選手を  身長、体重、握力、50m走タイム、遠投  などのデータを入れ、  を統計ソフトにかけ、  球団別にうまく分かれるか。  というのは主成分分析ですよね…?  また、上のような主成分分析を試行するのに  考えられる例はどのようなものがあるでしょうか?  データもあれば嬉しいのですが…。

  • 統計士とデータ解析士の違いを教えてください。

    業務でデータ分析を行っていますが、最近データマイニングまで進んだ形のreportを作る必要がある1サラリーマンです。 そこで統計を使う為に統計学を体系的に学びたいと考えています。 勉強するには、資格系が最も現実的かな。と思い、 いくつか調べたところ、「統計士」と「データ解析士」が一番近いようです。どちらも民間の資格のようですが、それぞれの強み(違い?)がよく わかりません。 現在どちらかをもっていて、選択した理由、もしくは、今後キャリアをひろげていく際にこちらの方が基本的な勉強に役立った、 などなど経験にもとづいたお話がきけえると嬉しいです。 ※現在SPSSなどのツールは、導入していません。 よろしくお願いします。

  • 相関分析で困ってます;統計初心者です。

    機械の故障発生の分析に統計手法が使えないか検討している者です。 例を上げますと、 ジュースの自動販売機の故障分析で、硬貨やお札を受付けて、何枚目程度で1件の詰まりが発生するのか?という分析です。 1ヶ月間に受付けた硬貨や紙幣の枚数と、詰まりが発生した件数はデータとして持っています。しかし、多くの台数を調べていくと、利用状況が当然ばらばらで、データも1つとして同じ物がありません。 このようなデータに対して、(硬貨・お札枚数)×(詰まりの発生件数)で相関分析(量×量それとも量×質??)を行っても良いものか決めかねています。受付枚数も詰まり件数も正規性がないので、データを変数変換等して正規化する必要があるのでしょうか? (データは詰まりが1~30件、硬貨・お札枚数が1000~5000のように非常にばらついています) なにぶん統計初心者でして、どうしてよいか困っております。ぜひご回答よろしくお願いします。

  • 統計解析のオススメ入門書を教えてください

    統計解析の入門書を探しています。主に以下の手法について詳しく解説あることが望ましいです。  ・主成分分析  ・因子分析  ・クラスター分析  ・コレスポンデンス分析 分析目的は、マーケティング戦略立案の前段階におけるマーケット・データ分析です。 前提として、数学はかなり苦手です。そこらへんも考慮していただけるとうれしいです。 よろしくお願いします。

  • データ解析ソフトについて

     統計学(データの分析や処理)をする際に、SPSSなどのデータ解析ソフトがたくさんありますが、どれも10万円前後するものばかりでとても手が出せる金額ではありません。  しかし、統計学をするにはデータ解析ソフトがかかせません。金額がかかってもしかたのないことなのでしょうか。

  • Rによる主成分分析

    統計解析用ソフトRを用いて主成分分析を行いたいと考えております。 しかし中々うまくいきません。 そこで、詳しい方がいたっしゃいましたら、主成分分析、主成分負荷量、バイプロットまでのプログラムを教えていただけないでしょうか。 解析対象のデータは以下の様なものです。データ数が21個、変数が13個です。   F G H ・・・  R 1  6 6  5 ・・・  2 2  5 6  1 ・・・  6 3  6 4  6 ・・・  5 : : :  : ・・・  : 21 3 6  4 ・・・  6 よろしくお願いいたします。

  • 自由度及び平均平方について(統計解析)

    お世話になります。 初歩的なことかと存じますが、ご回答いただきたくお願いいたします。 統計解析で ”平均平方=(平方和)/(自由度)”とあり、私は ”平方和”・・・ばらつきを表す指標 と理解していますが、「”平方和”を自由度で割る」ことが、何を表す 指標になるのか、理解できません。 自由度の意味を、根本的に理解できていないからかもしれません。 自由度及び平均平方について解説いただきたく、お願いいたします。 以下例題の分散分析表の、平均平方から、F値、p値へ進むに当たり 平均平方の部分で、つまづいています。 例) 要因  平方和  自由度 平均平方 F比  p値     回帰  1000.35   5    200.07  65.17  0.000    残差   78.17   26      3.01  よろしくお願いいたします。

  • アクセス解析の分析手法は?

    Webサイトにはアクセス解析がつきものですが、 その解析データを「分析」する手法は無いものでしょうか? 市販のソフトなどでログの解析は行えますが、 統計的な分析手法があったら教えてください。