• 締切済み

傾向スコアの求め方

統計初心者です。 今回、ある治療を行った人と行わなかった人で個々の因子の相違を検討したいと考えており傾向スコアで解析するよう指示を受けました。 患者ID 治療A      年齢  score1  病気A  病気B  病気C  001   行った      75    300    +     -    - 002   行わなかった  73    780    -     -    -  ・  ・ というようなデータがあり(約1600件)、患者ごとの傾向スコアを求めたいと思っております。 統計初心者なのでソフト(Dr.spss)を利用したかったのですが私が使っているSPSSのバージョンでは傾向スコアを出すことはできないようです。 SPSSを使って何かと何かの解析を組み合わせれば計算できるものなのか、あるいは傾向スコアを出す計算方法があるのでしょうか。 お手数おかけしますがどなたかわかる方がいらっしゃいましたら教えていただけませんでしょうか。 よろしくお願いいたします。

みんなの回答

回答No.2

自分も最近傾向スコアを用いた解析を行いたくて色々と調べていました。 ロジスティック回帰分析を行えばSPSSでも傾向スコアが算出できそうですが、以後のマッチングといった解析等はセミナーを受講しないと自力では難しそうですね。 IBMの解答→http://www-01.ibm.com/support/docview.wss?uid=swg21566422 セミナー一覧→http://www-06.ibm.com/jp/lsj/service/it/spss.shtml 最近は無料の統計ソフトのRや、そのGUIであるRコマンダーをつかって解析している人も多いようです。 http://rcommanderdeigakutoukeikaiseki.com/propensity_score.html で具体的な方法がまとめられているようです。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>統計初心者です。 研究の初心者、と判断、というより断言します。  これまで研究に関することをこの場で質問するのは、研究者として失格。厳しい表現ですが、理由が分からないと想うので、指示された人に訊いてみてください。やさしく教えてくれるバズ。  指示は、「自分で考えろ」ということ。丸投げでは救いようがありません。  また、統計ソフトは、学習してそれを利用するようにするのであって、研究に合わせたソフトなんぞは用意されていません。SPSSは、統計処理のツールであり、統計処理の方法を示してはくれません。SPSSは使ったことがありませんが、私ならエクセルでもできます。  傾向素スコアで解析、との指示なら、その人は統計の素人かプロ。「治療を受けた人と受けていない人では、有意差はあるか」という指示ではないのですか。    不安なのは「データがあるので、統計処理をしたい」という姿勢。これは、ド素人。 1) 目的をか考える 2) 統計処理の方法を考える 3) 統計処理に合わせて、データ集め  という手順が正しい、と教科書に書いてあるハズ。質問者だけではありませんが、1) → 3)で、2)が抜けている。  私も学生時代には理解出来なかったので、厳しいことを書きましたが、老婆心まで。  これ以上の回答が必要なら、 1)学生なのか、院生なのか、社会人なのか、 2)結果をどうするつもりなのか(公表するつもりなのか) 3)指示者に許可を得たのか  以上を明記してください。特に、「このような場で訊いても良い」との返事があったら、その旨を書いて、再度投稿して。

関連するQ&A

  • 因子解析をSPSS以外で…

    いままで統計処理はexcelに統計アドインを行ってなんとかしてきましたが、因子解析は行うことができません。新しい研究で因子解析を行う必要が生じたのですが、SPSSよりももっと安価で参考図書が充実しているソフトはないものかと探しています。 ご教示よろしくお願い申し上げます。

  • 新ペリアで有利なグロススコアは?

    競技方法:新ペリア 打数制限:ダブルパー HDCP上限:36 ハンデの計算方法は分かります。 この方式だとグロスがよい方がネットスコアも良くなる傾向がありますが、 過去の統計や計算等で、一番ネットスコアが少なくなる可能性の高い グロススコアというものは存在するのでしょうか。

  • 粗オッズ比と調整済みオッズ比

    粗オッズ比と調整済みオッズ比 ある因子(仮に高血圧)を持つ人が病気(仮に脳出血)になりやすいという2x2集計表がありオッズ比を算出すると20と出ました。ほかの因子(年齢や既往歴など)は単変量解析でp>0.30となっており、一応多変量解析も行いましたが高血圧のみ有意と出ています。統計ソフトのSPSSで調整済みオッズ比を算出してみると、0.04とでますがどう解釈すればいいんでしょうか?計算が間違っているのでしょうか、そもそも調整する必要があるのでしょうか?

  • SPSSについてご教授お願い致します。現在修士論文を執筆しております。

    SPSSについてご教授お願い致します。現在修士論文を執筆しております。 そこでSPSSを使っておりますが、先行研究と自分の解析結果が違いどうしようかと悩んでいます。 先行研究では41個の質問を6個の因子に分けています。同じように自分も6個の因子に指定して分析したのですが、質問項目が一緒になりません。 質問項目は先行研究のアンケートと一緒にしています。 自分の解析結果のアンケート項目を先行研究と合わせて、因子分析する方法はあるのでしょうか? 統計初心者のため、まったく的を得ていない質問かもしれませんが、何卒よろしくお願い致します。

  • エクセル統計での単変量解析の仕方

    エクセル統計(2010)での単変量解析の仕方を教えていただきたくメールしています。 まず、現在特定の疾患に罹患した患者の情報を、後ろ向きにある薬剤の併用群と非併用群とで病気の悪化までの期間、および生存期間にどう影響しているのかを検討する研究を行っています。  使用している薬剤の使用状況や患者背景などたくさんの因子が病気悪化や生存に影響していると考えられるため、多変量解析をしていくのが最も有用と思われますが、その前に、患者背景(年齢、性別、前治療歴など)の雑多な因子を単変量解析にて検討して多重共線性を解析した上でCox比例ハザードモデルで多変量解析したいと思っています。  そこで、最初のふるいわけをする単変量解析のやり方がよくわからず、エクセル統計2010を使用した場合、どのように開始していくのか教えていただければ幸いです。各調査項目に関してハザード比、95%CI、検定結果(p値)として標記したいと思っています。  よろしくお願いします。   

  • 単変量解析から多変量解析時の因子の絞り込み

    統計に関して全くの素人です。 教えていただきたい点は、ある病気の予後に関して関係があると予想した因子A,B,C,D,E,Fに関して単変量解析をしたら、A,B,Cが有意と考えられた場合、次に多変量解析を行う場合は、A,B,C,D,E,Fのすべての因子で解析して判断すべきでしょうか?それとも関連がありそうなA,B,Cによるモデルで解析するべきでしょうか? また、一般に単変量解析で関連がなかった因子が多変量解析では有意となることはないのでしょうか? 以上よろしくお願いします。

  • 有意差は無いが、・・・な傾向が認められるとは?

    統計の表現法の解釈に関して教えてください。 例えば、検定群A,対照群Bという2つのグループがあって、BよりAの方が平均値は少し高い結果が得られたものの、しかしバラつきが大きいため、統計的な有意差が無いと計算された場合、よく文献などで、 ”統計的に有意な差は無いが、Aの方が値が高い傾向が認められた。” などと表現されていますが、こういう表現はしても良いものなのでしょうか? 客観的な指標として統計を用いて差は確認出来なかったと計算されたのに、(おそらく期待した結果は差が出ることなので)心象としては差があると主張するのは諦めが悪いと言うか、話の進め方になんだか違和感があるのですが。。。

  • 2値データの解析方法について

    2値データの解析方法について 統計初心者です。 主観評価を2件法で答えてもらい、条件間で有意差があるかないかを調べるとき、どういった方法があるのでしょうか。 spssを使って解析するつもりです。 どなたかよろしくお願いします。

  • 欠損値の扱いに困っています

    統計解析の勉強をしております。初心者なので、ぜひお教え頂きたいと思い、投稿しました。 データの欠損値(アンケート回答など)はどのように扱うのが一般的なのでしょうか? 欠損のまま解析を実行すると、正確な結果が出ないとは思っているのですが...。本を読むと、平均値を代入とありますが、本当にその方法でいいのでしょうか?解析ソフトはSPSSを使用しております。 統計解析に詳しい方、勉強なさっている方、ぜひ回答宜しくお願いします。

  • residualizsdの意味を教えてください。

    統計用語の意味がわからず、困っております。  妥当性の検討ために、質問紙AとBのピアソンの相関係数が掲載されています。質問紙Aは2因子構造で、各因子の合計得点及び質問紙A全体の合計得点と質問紙Bとの相関係数が報告されています。  しかしそのあと、質問紙Aの各因子の得点をresidualizsd scoreとして、質問紙Bとの関連をみたと思われる数値が報告されています。  表には、        質問紙A on Corrrelation with 質問紙B  --------------------------------------------------------------------       質問紙A   因子1    因子2    合計    Purely 因子1  Purely 因子2            --------------------------------------------------------------------        質問紙B   .383**    .519**    .501**    .066       .348**         とあります。残差分析をしたのか、それとも、はずれ値を除外した上での相関係数なのかなどと考えましたが、まずは、residualizedとは何かがわかりません。他にもresidualizing scoreとも表現されています(英文です)。論文の主旨はよくわかるのですが、質問紙Bとの相関は因子1・2ともにあるのに、residualizedするると因子1には相関がないと言っていると理解はしております。  偏相関あるいは重回帰を行ったのかなとも思いましたが、そうでもなさそうです。論文に記載されている情報量が少なく、理解に苦しんでおります。  統計の初心者で申し訳ありませんが、何とぞよろしくお願いいたします。