toukeierのプロフィール

@toukeier toukeier
ありがとう数5
質問数0
回答数11
ベストアンサー数
3
ベストアンサー率
75%
お礼率
0%

  • 対応のある場合の2群の平均値の検定

    対応のある場合の2群の平均値の検定を行いたいと考えています。 通常であればwilcoxonテストでできると思うのですが、今回は少し例外的です。 2群、115列の検定には違いないのですが、比較対象が、100%のうち3つの成分が何パーセントを占めるかです。 例えますと、 アメリカ人と日本人115人の比較で、3種類のフルーツ(みかん、ぶどう、りんご)をどのような割合で食べているかを比較する検定で、 優位差があるかないかを調べたいと考えています。 例えば1人のアメリカ人は、30%のみかん、50%のぶどう、20%のりんごを、対する日本人は、20%のみかん、40%のぶどう、40%のりんごをといった感じです。 このような比較は可能なのでしょうか? 簡単に比較できて、P値の出てくるサイトはありますでしょうか?

  • 統計でカットオフ値を求める際の質問です

    統計のド素人なもので教えて下さい。 歯医者に通院している患者さんの身長や体重、年齢、歯の痛さの尺度の値など(合計15項目ぐらい)のデータを使って、虫歯の予後に関わる因子のカットオフ値、感度、特異度を求めたいと思います。 症例数が22人しかいませんが、この少人数のデータでこういった解析を行う意味はあるのでしょうか? もし症例数が足りないということであれば、最低何症例あれば可能なのでしょうか? よろしくお願いします。

  • 重回帰分析と分散分析の結果が違う

    次のようなRのコードを書きました。 x1~x7は因子で、1がなし2がありだと思ってください。 最後のxがデータです。これが大きい程よいと言う意味だと思ってください。 data <- data.frame( x1 = c("1","1","1","1","2","2","2","2"), x2 = c("1","1","2","2","1","1","2","2"), x3 = c("1","1","2","2","2","2","1","1"), x4 = c("1","2","1","2","1","2","1","2"), x5 = c("1","2","1","2","2","1","2","1"), x6 = c("1","2","2","1","1","2","2","1"), x7 = c("1","2","2","1","2","1","1","2"), x = c(35,48,21,38,50,43,31,22) ) data colnames(data) <-c("B","C","B:C","D","B:D","A","7","x") data summary(aov(x ~ A+B+C+D+B:C+B:D,data=data)) summary(lm(x ~ A+B+C+D+B:C+B:D,data=data)) 結果としましては、 分散分析では因子C以外は有意差がないという結論を出しており、 重回帰分析では因子Bと因子B:D以外は有意差がないという結論を出しています。 重回帰分析と分散分析は基本的に数学的にやっていることは同じと言われたのですが、結果が異なり戸惑っています。 なぜこのようなことになったのか心当たりがある方ご教授ください。 よろしくお願いします。

  • ダミー変数を用いた重回帰分析での影響度の比較

    ダミー変数と連続変数の両方を含むデータで、重回帰分析を行おうとしています。その際、各説明変数の目的変数への影響度の大きさに興味があります。 連続変数のみの重回帰分析であれば、標準偏回帰係数の大小で影響度が比較できると思います。 またあるWebページでは、ダミー変数のみの重回帰分析(数量化1類?)では、各アイテム変数のレンジ・単回帰係数・偏回帰係数などで比較をしていました。 しかしダミー変数と連続変数が同時に含まれる場合は、各説明変数の影響の大きさをどのように比較すれば良いのでしょうか。 例えば下記参考URLのWebページで、単価・曜日・天気から売り上げ本数を予測していますが、最後の方で出てくる係数は単価、日~月までの7種類、曇~雨の3種類、の合計11種類の係数が出ています。 これを単価・曜日・天気の3種類の影響度という形にして比較する、という事は可能なのでしょうか。 偏回帰係数とレンジをそのまま比較はできないと思うのですが、方法はあるのでしょうか。 参考URL: http://homepage2.nifty.com/nandemoarchive/toukei_hosoku/tahenryo_jirei_02.htm

  • 製品の統計について

    統計についてお伺いしたい事があります。 製品の強度規格の設定で、一定の下限値より大きければ、上限については問題がないという条件で、統計を出したいのですが、どのような統計を用いればよろしいでしょうか? 現在、標準偏差の使用を試みたのですが、うまくいきませんでした。 引っ張り強度についての条件設定を検討しておりますが、N=40で試験を行った時、150N~398Nとばらつきが存在致しました。 下限条件として150N以上という設定を行おうと考えましたが、平均値-3σの値は非常に小さくなり、平均値から逸脱した値を用いずに計算を行っても、平均値-3σの値はなかなか大きくならず、ほとんどの値を計算から省かなくてはならないという状態でした。 つきましては、どのような統計の出し方が良いのか教えて頂きたく、質問させて頂きました。 よろしくお願い致します。