• ベストアンサー

統計学で質問です。

いつもと趣向が変わりますが、統計学のTest for Normalityで質問です。現在SASを使ってあるデータの skewness と kurtosis をテストしようと試みています。ですが、これらのhypothesis testingをどうやってSASで行うのかなぜか調べてもわかりません。具体的には5%のレベルでテストしたいんですがどなたか方法をご存知でしたら教えてください。SASでなくても構いません。

質問者が選んだベストアンサー

  • ベストアンサー
  • dunnett
  • ベストアンサー率24% (16/66)
回答No.1

一変量の分布から入り,表示オプション,次により高次のモーメントにて,とがり度およびひずみ度が表示されます.両者を加えて3程度ですとデータは,正規性を維持していません. そのほかは,分布のあてはめ,次に,正規性次に正規性のあてはめ,次に適合度でShapiro-Wilkの正規性の検定ができます.この場合はSAS JMPです.正規性の検定手法はそのほかにいくつかありますがすべて検出力が異なります.広く使用されているのが上述の解析法です.私はこの手法を推奨します.

mathematical
質問者

補足

ご解答ありがとうございます。今現在行っているテストはまずShapiro-Wilkの正規性をテストし、それが正規性を示さない場合にskewnessを検定し、それが更に受け入れられない場合はkurtesisの検定を行うというものです。16年度分のデータのうち15でShapiro-Wilkの正規性が示されなかったので次にskewnessをテストしようとしたのですが、どういう検定法で5%の適合度を調べれるのかを今調査しているのです。なにかご存知でしょうか?

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • solla
  • ベストアンサー率59% (45/76)
回答No.2

歪度や尖度を仮説検定するというのはあまり聞いたことがありません。skewness, kurtosisの標本分布が簡単には求められないのではないでしょうか。数値計算すれば出せるのでしょうけど、それだけの需要が無いのかもしれません。正規性の検定でしたら#1さんがおっしゃるようにShapiro-Wilk testや、SASなら経験分布に基づくKolmogorov-Smirnov test, Anderson-Darling test, Cramer-von Mises testが利用できますから、通常はこれで充分なのかと思います。 それでもどうしても必要ならブートストラップ法を使えばできるかもしれませんね。ある程度のサンプル数と、SASではマクロプログラミングが必要になるかと思いますが。

mathematical
質問者

お礼

結局無事に見つけることが出来ました。お時間どうもありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計学

    統計学の問題です。 > t.test(a,b,var.equel=TRUE,conf.level=0.99) Welch Two Sample t-test data: a and b t = 0.4175, df = 21.955, p-value = 0.6804 alternative hypothesis: true difference in means is not equal to 0 99 percent confidence interval: -8.150055 10.983388 sample estimates: mean of x mean of y 72.16667 70.75000 コレ↑は、Rでの実行なのですが、これは、2つの母平均の差がゼロであるかどうかの検定を有意水準5%で行えていますか? >alternative hypothesis: true difference in means is not equal to 0 99 percent confidence interval: この部分から、ゼロでないという結果がでているように思うのですが。。。 回答よろしくお願いします。 足りない部分があれば補足します。 よろしくお願いします。

  • 統計ソフトRからSASへ

     大学の授業で心理統計学の授業があるのですが、私は今までExcelとRを併用していました。しかし、授業ではSASを用いるようなのです。  別に自分の研究のためだけならこのままでいいのでしょうが、SASを使って授業をやるとなるともしかしたらいろいろと不便なことが多くなるのではないかと思います。そこで、SASの購入を検討してみようと考えているのですが、統計解析ソフトというのを購入したことがないのでどのようなものかいまいち分かりません。  買うだけ買ってみて、全く使い方が分からない(オーバーですが)なんて事があっては値段的にシャレになりません。実際、ExcelとRを愛用しているので、また操作方法などを1からやり直すとなると荷が重いきもします。  そういうことで、どなたかアドバイスをいただけたら幸いです。それとは別に、『エクセル統計 2004 for Windows アカデミック版』という商品があるようですが、調べてみると結構便利そうなので購入してみようかと考えています。もし、使ったことがある方がいらしたら、どんな感じか教えてください。

  • 統計学に関する質問です。

    統計学に関する質問です。 1.統計書で「正規分布する母集団から独立に得たX1、X2、…Xn」という記載がありますが、ここでの「独立に得た」は具体的にどういう意味でしょうか? 2.『Q&Aで知る統計データ解析』という本に「測定値の独立性」に関する記載があり、「同じ被験者の反応が同一条件下で反復して測定される」場合、「観測値は独立とはいえない」といった解説がありました。この「観測値の独立性」とは具体的にどういう意味でしょうか?単一事例からベースラインをとり、その後介入期を設けて、それぞれから得た観測値を検定にかけることは統計誤用でしょうか? 以上、宜しくお願い致します。

  • 確率・統計的な考え方について質問です

    確率・統計的な考え方について質問です。 いま、終末期介護施設において、何人の入居者の方がいた場合、一日に亡くなる方の人数が(平均して)1人になるのか -(A)    という問題を考えています。 用いることができるデータとしては、いまのところ、2年間死亡率が40%(すなわち、いま施設に100人いるとして、2年後に施設に生存している方が60人となる)というデータのみです。 ここで、上記のデータのみで(A)の問題に答えることができるのでしょうか。また、必要なデータが足りない場合、どのようなデータをどのように組み合わせれば(A)の問題に答えることができるでしょうか。 高校レベルのみならず、大学レベルの高度な統計処理を用いても構いません(その場合は計算方法もご指導いただけるとうれしいです)。また、必要なデータが足りない場合は、できるだけ入手が容易そうなデータ(厚生労働省が提示しているようなデータ、等)を用いる方法のほうが良いです。 なお、この問題は大学のレポート課題等ではありません。 よろしくお願いします。

  • 統計学の直線回帰について質問です(英文)。

    英文で記された以下の統計学的処理についての質問です。 The following groups were tested in linear regression for Y to X: all animals, all males, all females, all typeA, all typeB, and typeC. The slopes for type and gender groups were compared by generalized linear regression. The assumptions were checked and the following model was fit: Y~X + gender + type + (gender*X) + (type*X) + (gender*type*X) The hypothesis of no gender difference in slopes was tested by the significance of the term “gender*X”, and the hypothesis of notype difference in slopes was tested by the significance of “type*X.” これはタイプA,B,Cのとある動物のオスとメスに関するデータの統計処理の話なのですが、 (イメージとしては白人、黒人、黄色人の男性と女性に関するデータ) とあるデータYのXに対する相関を、すべての個体群、オスの個体群、メスの個体群、タイプAの個体群、タイプBの個体群、タイプCの個体群内において、 直線回帰(linear regression)で調べた、というのは理解できるのですが、次の一文で、 The slopes for type and gender groups were compared by generalized linear regression. 各タイプ群、各性別群における傾き(回帰直線の傾き!?)は一般線形モデルでテストされた。 とあり、以下、仮説(assumptions)が何やら複雑な線形モデルでチェックされたとありますが、 当方統計学にはあまり詳しくなく、この操作が何を行っているのかわからず、 また、どのような資料を参照すればよいのかもわかりません。 なお、式中の*は、実際には上付き書式になっていました。 さらに、assumptionとhypothesisはどちらも仮設という意味ですが、単なる言い回しでしょうか? それとも統計学では厳密に区別して使われている言葉なのでしょうか? 以上長文で申し訳ございません、拙い文章と情報量で、解答しにくいかもしれませんが、 分かる範囲で結構ですので、ヒント、アドバイス等よろしくお願い申し上げます。

  • 統計データの「タイル値」とは何でしょうか?

    医療データ(他のデータでも使われるとは思いますが)でタイル値という統計の値が良く使われ、前後の文章からはある程度意味はわかるのですが、具体的にどのように算出されるのかがわからず悩んでおります。私は数学が余り得意でありませんのでそのようなレベルの人にもわかるようにご教授願い致します。不躾な質問の仕方で申し訳ありませんが宜しくお願い致します。

  • 統計ソフトSASの出力について

    自分は心理学科で 現在、質問紙をSASで統計処理しています。 結果が出力される際、コンマ以降が5ケタほど表示されますが 表示されるのを2ケタまでにすることはできますか??

  • 統計を使用したデータ分析について

    8人の被験者に、10回実験を行い、データを取りました。その結果を4種類に分類し、レベル1、レベル2 レベル3 レベル4に分類しました。ざっと見て、レベル1が一番多く、レベル2,3、4とだんだん少なくなっています。これを統計的に証明したいのですが、いい方法はありますでしょうか?レベルが上がるほど少なくなる効果があるということが言えればいいのですが。どのような統計の手法を使えばいいのか教えていただければありがたいです。宜しくお願いいたします。

  • 世界の統計

    GDPや対外純資産と言ったものから、平均寿命といったものまで、幅広く世界の統計を扱ったデータを探しています。統計局の出している世界の統計2002などは高いので購入できません。調べるのにいい方法をご存知ありませんか?

  • 競馬の統計を取るソフトを作りたいのですが・・

    競馬の統計を取るソフトを作りたいのですが・・ 現在、自分で競馬の統計を取りたくて、Excel やmysqlを使って行おうと考えています。 私が取りたい統計データは ・東京1600Mの過去すべての平均タイムとか ・馬場条件によるタイムの違い(良・不良などの違い) ・斤量によるタイムの変化(回帰データ) ・年齢によるタイムの変化(回帰データ) ・オリジナル指数で賭けた場合の勝率(バックテスト) などなどです。 これらをデータを取りたいのですが、方法が分かりません。 一からこれらのことが行えるソフトを作ったことがある方はどのような方法を取っているのでしょうか? また、参考になるHPや著書があればお教えください。