• ベストアンサー

統計についての文を添削してください

統計のことはぜんぜん理解していないものです。 どなたか私の文を添削していただけないでしょうか? 言葉遣いがおかしいとか、意味が違うとか指摘していただけると助かります。 サービスの品質改善というテーマで翻訳をしていたのですが、調査をおこないデータを整理して結論をだすために、統計の手法を使うことができる、という部分がでてきて困っています。 ネットでいろいろ学習??しましたが、あっているかどうかまったく自身がありません。 よろしくお願いいたします。 カイ二乗‐2つの変数の間での関連を決めるための統計技術。(1)観察されたデータが期待とマッチするかどうかを見る、(2)一方の変数の分布がもう一方の分布と関係があるかみる。 t-検定-サンプルが同じ人口から選べれているかを見るため、2つの個別サンプルの平均や割合を比較する統計技術。(3つ以上のサンプルの平均をテストするには、分散分析が使われます) 重回帰-複数の変数の値の変化によって、1つの変数の変化の値を予測するための統計技術です。 クラスタ分析-対象(学校/場所/物など)を特定された数の排他的グループ(内部的に同種)に分ける統計技術。 因子分析‐相関関係をもつ変数の大きなセットの要因を決める統計技術。 判別分析-人や物を2つ以上のカテゴリーに分類するための統計技術。 カイ二乗による相互作用の自動検出方法(CHAID)‐分岐方法を使って、因数のなかの相関と見つける統計技術。 以上です。

質問者が選んだベストアンサー

  • ベストアンサー
  • beeba
  • ベストアンサー率49% (25/51)
回答No.4

統計用語サイト(英和・和英)が見つかりました。 カイ二乗 ○期待 → 「期待値」 CHAID ○分岐手法 → 「分類木法」「樹形分析」「木分析」(自信ないです)

参考URL:
http://www.qmss.jp/qmss/glossary/
ookinaki5
質問者

お礼

辞書をわざわざ見つけてくださって、感謝です。 これからも使っていきます。本当に助かります。 あと、用語の添削もありがとうございました。 適切な言葉がわからなかったので、本当にたすかりました。

その他の回答 (3)

  • Diogenesis
  • ベストアンサー率49% (859/1722)
回答No.3

用語についてだけ。 原文がないので推測まじりですが。 ●人口 → 母集団 :これはたぶん“population”ですね。 ●相互作用 → 交互作用 :これは“interaction”でしょうか。 また次の用語については 原文になくても単語を補ったほうが収まりが良くなると思います。 ●カイ二乗 → カイ二乗検定 ●重回帰 → 重回帰分析 ついでに ●統計技術 → 統計手法(統計技法) :個別の分析法を指すなら後者のほうがしっくりくるような気がします。

ookinaki5
質問者

お礼

ご回答ありがとうございました。 おかげさまで言葉遣いがより専門的にグレードアップできました。私は相変わらず統計はよく理解できていないのですが、理解していらっしゃる方にご指摘いただきまして、安心できました。 本当に助かりました。ありがとうございました。

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 3つ以上のサンプルの平均をテストするには、分散分析が使われます これは分野にもよるのかもしれませんが,通常はサンプル(標本)ではなく群もしくは水準という言い方をします。でもこの場合は人口という大規模なものですから標本といっても良いのかもしれません。ちなみにt検定は平均値に関する手法であって,比率の違いを検定するものではありません。 >複数の変数の値の変化によって、1つの変数の変化の値を予測するための統計技術です。 重回帰分析とはある変数(目的変数)を複数の変数(説明変数)によって説明する分析方法です。なので"複数の変数の値"というのは説明変数とし,"1つの変数"という部分を目的変数としたほうが良いでしょう。 >相関関係をもつ変数の大きなセットの要因を決める統計技術 因子分析とは「多変数を少数の共通因子で説明する」分析なので,この説明ではちょっと伝わりにくいかもしれません(確かに変数同士の相関係数が低い場合は因子分析してもあまり意味がないので間違ってはいないとおもいますが)。

ookinaki5
質問者

お礼

ご回答ありがとうございました。 ご回答を読むのも私は一苦労。。。という有様です。。。 上の2点は直しました。 3番目は『ちょっと伝わりにくい』とのことでしたが、ぎりぎりセーフかな??と安心することにしました。(原文がそのレベルなのかもしれません)。 やっぱり私には理解できない世界ですが、理解している方に添削していただいて、安心できました。 ありがとうございました。

  • ssmarugoo
  • ベストアンサー率47% (84/176)
回答No.1

カイ二乗検定と、t検定、クラスタル分析、因子分析しかやったことないですけど、 少なくともそれらは間違ってないと思いますよ。 ※カイ二乗検定のところは、(1)と(2)に分ける必要はないと思いますよ。(2)のみでいいと思います。(1)は、仮説を立てて検定を行うという意味なので、・・・・確かにカイ二乗検定で行いますが、それならt検定も仮説検定を行うので。 あと、カイ二乗のところの変数は「質的変数」としたほうがいいかもしれませんね。 他のところの変数はそのままでいいと思います。→量的変数のことをさしていますが、カイ二乗のところだけ「質的」を加えると、それと区別して必然的に量的という意味にとれますからね。

ookinaki5
質問者

お礼

ご回答ありがとうございます。 ご回答をよんで理解しようとしましたが、基礎がないのでやっぱりわかりません(涙)。 ご指摘の点使わせていただきます。 ありがとうございました。

関連するQ&A

  • 統計の初歩の初歩です(文系)

    すみません、教えていただけますか?社会学、心理学系のアンケート調査の結果を分析しています。統計の初歩のことを伺いたいのですが… 2つの変数を使って、まずクロス集計を出した時にカイ二乗検定をみると有意ではありませんでした。 でも次に相関分析をして、 相関係数を出してみる有意になるんですが、良いのでしょうか?? つまり、カイ二乗検定が有意でなくても、相関分析で相関係数が有意であれば、 関連がありそうだと考えてよいですか?? よろしくお願いいたします。

  • 統計学(t値を2乗するとF値になる)について

    本に「t値を2乗するとF値になる」とあり、実際に確かめてみたところ、たしかに両者の値は一致しました。 しかし、なぜそうなるのかがわかりません。 本には、 t=(標準正規分布に従う変量)/【(自由度nのカイ2乗分布に従う変量/n)の平方根】であり、 F=【(自由度nのカイ2乗分布に従う変量)^2/n】/【自由度mのカイ2乗分布に従う変量/m】に2乗すると一致すると解説がありました。 しかし、「tってこんな値だっけ?」という点でひっかかっています。例えば、分子は「標準正規分布に従う変量」となっていますが、私が学んできたt値の分子は例えば「得られたデータの平均-μ」や「標本平均の差」などであり、標準誤差で割らないと「標準正規分布に従う変量」にならないのでは?と思ってしまいます。分母は尚更わかりません。 どなたか、噛み砕いて教えて頂けると有難いです。宜しくお願い致します。

  • 確率統計における確率分布の定理について

    検定を行うときの確率分布のあてはめで、 データをk個の事象に分けて統計量X^2を求め、それが自由度k-r-1のカイ2乗分布に従う、 rは期待値を求める際に母数で推定したももの個数で、標本平均と標本分散を使用したとすればr=2、 という定理を使うと思うのですが、 例えばデータを身長として検定を行う場合はそれを標準化して、 期待値の算出にサンプルの平均、標準偏差を使うのでr=2で自由度はk-3になりますよね? ここで上の定理が正しいことを確かめるためにデータを1,000個ほどの標準正規乱数として、X^2を複数回求め、 その分布が実際にカイ2乗分布に従うかどうかを調べるときは自由度はどうなるのでしょうか? 1,000個の標準正規乱数が実際に標準正規分布に従うとして平均=0、分散=1として行う場合はr=0、 また標準正規分布に従うかではなく1,000個のサンプルから新たに平均、標準偏差を求めてX^2を求める場合はr=2となると考えたのですが、これは正しいのでしょうか? わかりにくい文ですみません。 よろしくお願いします。

  • 確率統計に詳しい人よろしくおねがします。わかる問題だけでいいので教えて

    確率統計に詳しい人よろしくおねがします。わかる問題だけでいいので教えてください。○×です。理由もわかれば教えてください。 1. 平均μが5以上であればポアソン分布は通常近似的に正規分布とみなしてよい。 2. 2つのカイ2乗分布の比はF分布にしたがう。 3. 母集団からランダムに取ったn個の試料の平均値の期待値は母集団に等しい。

  • 確率統計

    確率変数Xが自由度14のカイ2乗分布に従うとき、次の値を求めなさい。     P(10.82≦X≦16.22) どう、答えまで導くかがわかりません。 正規分布ならわかるのですが・・・。 nS^2/σ^2の式を用いるのでしょうか?? 初歩的な質問ですみません。

  • [統計学]カイ2乗分布

    カイ2乗分布について多くの入門的教科書では、 > 確率変数 X1, X2 が正規分布 N(0,1) に従うとき、 > Y = X1^2 + X2^2 で与えられる確率変数 Y はカイ2乗分布となり、 > 以下の式で表される: > (分布関数) のような説明がなされていると思います。 このとき、X1, X2 が異なる正規分布 N(e1, v1), N(e2, v2) に従う場合には、 そのカイ2乗分布はどのような式で与えられるのでしょうか。 (e = X の平均値, v = X の分散) おそらく簡単すぎるために、説明が省かれているのだろうと思うのですが、 自分にとっては簡単ではありません。 詳しく載っている書籍・ウェブサイトを挙げるだけでも構いませんので、 御教示お願いいたします。

  • 統計の問題です。大至急、解答お願いします。

    統計学の問題です。自分でやってみたのですが、解けなくて、困っています。どうか解答、解説をよろしくお願いします。問題は、以下です。 確率変数Xが一様分布U(0,1)に従うとき,Y=-2logXは,指数分布Ex(1/2)に従う,すなわち,自由度2のカイ2乗分布に従うことを示せ。

  • 以下の統計学の問題の解説をお教えください。

    以下の統計学の問題の解説をお教えください。 (1)100人の学生の現在と10年前の身長を記録したデータによれば、現在の身長の平均は170cm、標準偏差は10cmであり、10年前の身長の平均は150cm、標準偏差は6cmである。このデータから、各学生の現在と過去の身長の和を計算すると、その平均と標準偏差はどのようになると考えられるか。以下の選択肢a-fの中から最も正しいと思われるものを二つ選べ。 a.和の平均は320cmである b.和の平均は320cm以上である c.和の平均は320cm以下となる d.和の標準偏差はほぼ12cmとなる e.和の標準偏差はほぼ16cmとなる f.和の標準偏差はほぼ13cm以上16cm以下となる (2)以下の中から正しいものを全て選べ。 1.分布が単峰の場合、中央値は、平均値と最頻値の間にある。 2.ヒストグラムを描いたときに、左裾が長い分布の歪度は負となる。 3.標準正規分布をする確率変数が1.96を超える確率は約0.025である。 4.ひとつの変数群を、他の変数群で説明しようとする統計的手法の典型的なものは、回帰分析と呼ばれている。 5.Tが自由度5のt分布をする確率変数、Zが標準正規分布をする確率変数である場合、Pr(T>1.96)のほうがPr(Z>1.96)よりも小さい。 6.統計的検定を行う場合、直接にコントロールされるのは、第1種の過誤のみで、第2種の過誤は間接的にコントロールされる場合が多い。 7.通常、第2種の過誤を犯す確率は、サンプル数を増やすと大きくなる。 8.カイ二乗分布は、比率の標本分布として用いられることが多い。 9.二つの確率変数が独立の場合、その和の分散は、それぞれの分散の和となる。 10.順序尺度水準で測定されている変数を使った分析の結果は、その変数に単調増加変換を施した別の変数を用いた分析結果と変わらないはずである。 (3)ある世論調査で、内閣支持率が35%でその95%信頼区間の幅が±5%と出ていた。この解釈として最も適当なものを選べ。 a.内閣支持率は、ほぼ30%から40%の間にある b.内閣支持率が35%であるという仮説は5%水準で有意である c.内閣支持率が35%でないという仮説は5%水準で有意である d.内閣支持率が35%である確率は5%である

  • 高校数学の確率・統計領域について。

    高校数学の確率・統計領域について。 どの辺りまで扱うべきだと思いますか。 【1年】 個数の処理(集合の要素の個数,和の法則・積の法則,順列,組合せ) 確率(確率の基本的な法則,独立な事象と確率,確率の乗法定理) 【2年】 データの分析(データの散らばり,データの相関) 確率分布(確率変数の平均・分散・標準偏差,二項分布の平均・分散・標準偏差) 【3年】 正規分布,統計的な推測(母集団と標本,推定,検定)

  • 次のような場合に適した統計手法を教えてください

    統計初級者?ぐらいの者です。 基礎的な回帰、重回帰分析ぐらいまでならいちおう(クリック統計学レベルで…)理解しているのですが、いろいろと実作業をやっていて、わからなくなったので質問させていただきます。 さて、 調査の中身自体は全く違いますが、実際に次のような分布のデータがとれました。 -------------------------------- 【取得できたデータの概要】 -------------------------------- 家族の人数と、現在の生活に対する平均満足度に対するアンケートを5000人に行ったとして、 ■A. 生活満足度×家族の人数の相関  まず、家族の人数と、生活満足度を、シンプルにピアソンの相関係数で測った場合、-0.16程度しか出てきませんでした。5000人で、-0.16であれば、弱い相関は確実にあり、p値も、0.001以下になりました。  ただ、調整済み決定係数は、0.1未満…。正直、かなり弱い相関で、今ひとつインパクトに欠けるデータです。 ■B. 平均生活満足度×家族の人数の相関  また、少しデータの見方を変えて、家族人数が1人の時、2人の時、でそれぞれ、生活満足度の平均をとってやったとします。(この場合の「平均」はシンプルに算術平均をとりました。) 1人の時の平均生活満足度:4.5 (n=1500) 2人の時:4.4 (n=1000) 3人の時:4.3 (n=1400) 4人の時:4.2 (n=600) 5人の時:4.1 (n=300) 6人の時:4.0 (n=200) 7人の時:3.9 (n=100) というようなことが、わかりました。 このとき、 「平均生活満足度」と、「家族の人数」で、 相関をとればキレイに「-1」になるかと思います。 回帰曲線も、キレイな線が引けます。 ---------------------------- 【質問の本題】 ---------------------------- 質問の本題は、B.平均生活満足度×家族 の分析のほうになります。 B.の分析で、確かにキレイな数字は出てくるのですが、 こういった形で、分析をしてしまうと、 実際には、5000人のデータを取得しているにも関わらず、 300人ぐらいのデータでも、同じ平均が出てきたら同じ結果になってしまうかと思います。 それぞれのサンプル数が、500人いる場合とで、 サンプル数が10人いる場合とで、行うべき検定等の手法が異なってくるのではないかと思うのですが、 この場合、どのような処理を行うのが適切なのでしょうか。 ご指導お願い出きましたら幸いです。 よろしくお願いいたします。