• 締切済み

実務で役立つ統計知識

OKwaver25の回答

  • OKwaver25
  • ベストアンサー率83% (36/43)
回答No.1

「統計学の初歩」としては、以下のキーワードも理解されていると良いかと思います。(主観です。) ・相加平均(算術平均) ・期待値 ・分散 ・標準偏差 ・散布図 ・ヒストグラム お役に立てれば幸いです。

関連するQ&A

  • トリム平均の良いやり方

    教えてください。 外れ値を除いて平均値を出したいとき、トリム平均(あるいは中央平均)というものがあると思います。 このとき、トリムが10%だったり、20%だったりするのは恣意的な基準だと思ってしまいます。 そこで、標準偏差2つ、または3つ以上外れた数字を外れ値として定義し、外れ値を取り除いて再度平均値を求めることであるグループの数値的な特徴を把握しようとしていますが、これについて、良い方法だと思いますか? また、ほかの方法で、恣意的ではない平均値の求め方がありましたら、何か教えて頂けますでしょうか。 よろしくお願いします。

  • 統計学について

    統計学の無相関検定について 無相関検定について理解ができておらず、 どなたか教えてください。 理解できていない場所を理解したいので、 非常にまとまりがありませんが、箇条書きとしました。 番号ごとに箇条書きしたので、 番号に対応するように回答を頂けると幸いです。 よろしくお願いします。 (1)無相関検定により、帰無仮説が採択されると、相関係数の数値の大小に関係なく、一律で統計結果自体を無効にする。 (2)統計結果自体の無効とは、すなわち相関係数ゼロのことを指す。 (3)相関係数ゼロとは、すなわち無相関のことを指す。 (4)「相関の強さ」と「有意」は別個の考え方である。 (5)「相関が強いこと」=「相関係数が1または-1に近いこと」である。 (6)相関が強い場合でも、有意でない場合は、「統計自体が無効だった」ということになる。 言い換えれば、「統計結果は無相関だった」という解釈になるのだろうか? (7)相関が弱い場合で、かつ有意である場合は、「弱い相関があった」ということになる。 (8)「統計自体が無効だったこと」=無相関なのか? (9)「相関の強さが弱過ぎる」=無相関なのか? (10)相関があるという仮説の数は無限であり、相関が無いという仮説の数は1つである。 11.相関係数がゼロであることは、無相関検定をやること以外の方法では生じない。 つまり、変数が2つのとき「偏差積の平均÷標準偏差X÷標準偏差Y」の計算結果によって、相関係数がゼロという答えが出ることはない。(無相関検定をやる前から無相関であるという答えが導き出されることはない) 非常にまとまりが無くて申し訳ありませんが、よろしくお願いします!

  • 統計について教えてください

    Q:あるクラス10名の国語と算数の成績は次のようになった。国語の算術平均(X)、最頻値、標準偏差を求めなさい。次にC君の国語の標準得点と偏差値を求め、単位正規分布表を見ながらC君の成績の相対的位置が何%か求めなさい。さらに国語と算数の相関係数を求めなさい。 国語4.9.4.8.7.8.4.7.3.1(10名) 算数3.1.4.3.8.4.8.6.1.2(10名) C君国語4点 算数4点 途中から曖昧になってわからなくなってしまっています。 誰か助けてください。よろしくお願いします。

  • 平均値、変動係数の質問です。平均値ですが年齢やある値の平均値を〇〇±〇〇と表示...

    平均値、変動係数の質問です。まず平均値ですが年齢やある値の平均値を〇〇±〇〇と表示しているのを見かけますがこの〇〇±〇〇の±〇〇は一体何の事を表しているのですか?例えば,0.85,0.8,0.75,0.66,0.46の平均値は〇〇±〇〇の表示法ではどのようになるのですか?またこれのExcelでの計算方法は? 次に平均値と変動係数の値がどのような関係になれば両者の間に統計学的な有意差が見られたと判断できるのですか? よく理解ができませんのでどなたか統計学素人の私に理解できるようご回答お願いいたします。

  • 最近大学の授業の基礎統計学という分野で平均・中央値・最頻値・分散などと

    最近大学の授業の基礎統計学という分野で平均・中央値・最頻値・分散などといったことを学びました。 そこで質問なんですが、分散の説明を全く聞いてもわかりません。 平均を使っていろいろやることわかるのですが、正直自分の馬鹿な頭ではちっとも理解できませんでした。 分散のわかりやすい参考サイト(Σとか使ってないのがいいです。)など、分散を説明できる方がいたらおしえてください。おねがいしますm(__)m

  • 統計学の練習問題 解説が理解できないので…

    統計学の練習問題を解きたいのですが、解説が理解できないので教えてください。 「世帯数が約10万の市でn世帯を無作為に抽出して各世帯の人数を調べて市の人口を推定する。 推定量の変動係数を5%以下にするためには 抽出する世帯数nはおおよそいくら必要か。 ただし母集団の変動係数は1.0以下であることがわかっている。」 解説には 「世帯数を推定するのに推定量の分散が最大となる場合、つまり母集団の変動係数が1.0である場合を考えて、この場合でも推定量の変動係数が5%以下になるように標本サイズを定めればよい。標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。これが5%以下になるためには、標本サイズは(1/0.05)^2=400以上あればよい。」 と書いてあります。 理解できないのは、 『標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。』 この部分です。 変動係数=標準偏差/平均値 標準誤差=標準偏差/√n というのは調べました。 どうして『』のような流れになるのでしょうか? 教えてください。よろしくお願いします。

  • 線形変換

    データを線形変換したときに、不偏な統計量は標準偏差、2群の平均値のt値、変動係数、ピアソン相関係数のどれになるのでしょうか?(答えは二つあります) 大変申し訳ありませんがどなたか教えていただくことはできますか。 宜しくお願いいたします。

  • 自然対数に変換する意味がわかりません

    ある化学分析の本に、2組の時系列データについて、変動パターンの相関係数を求めるのに、移動平均との比(×100)を自然対数に変換して相関係数を求める、との説明がありました。こういう場合、自然対数に変換するのにどういう意味があるのでしょうか?

  • 相加平均と相乗平均の関係の意味

    (相加平均)≧(相乗平均)はわかりました。 さらに、これを利用すると様々な不等式が証明できることもわかりました。 (分かったといっても初歩的なところですが) ただ、証明問題が、印象として、(相加平均) ≧ (相乗平均)を使わせるための証明問題というように感じてしまいます。 それは、(相加平均) ≧ (相乗平均)の意味を理解していないからだと思うのですが、この関係はそもそもどんな意味があるのでしょうか。 漠然とした質問ですがお教えください。

  • 次のような場合に適した統計手法を教えてください

    統計初級者?ぐらいの者です。 基礎的な回帰、重回帰分析ぐらいまでならいちおう(クリック統計学レベルで…)理解しているのですが、いろいろと実作業をやっていて、わからなくなったので質問させていただきます。 さて、 調査の中身自体は全く違いますが、実際に次のような分布のデータがとれました。 -------------------------------- 【取得できたデータの概要】 -------------------------------- 家族の人数と、現在の生活に対する平均満足度に対するアンケートを5000人に行ったとして、 ■A. 生活満足度×家族の人数の相関  まず、家族の人数と、生活満足度を、シンプルにピアソンの相関係数で測った場合、-0.16程度しか出てきませんでした。5000人で、-0.16であれば、弱い相関は確実にあり、p値も、0.001以下になりました。  ただ、調整済み決定係数は、0.1未満…。正直、かなり弱い相関で、今ひとつインパクトに欠けるデータです。 ■B. 平均生活満足度×家族の人数の相関  また、少しデータの見方を変えて、家族人数が1人の時、2人の時、でそれぞれ、生活満足度の平均をとってやったとします。(この場合の「平均」はシンプルに算術平均をとりました。) 1人の時の平均生活満足度:4.5 (n=1500) 2人の時:4.4 (n=1000) 3人の時:4.3 (n=1400) 4人の時:4.2 (n=600) 5人の時:4.1 (n=300) 6人の時:4.0 (n=200) 7人の時:3.9 (n=100) というようなことが、わかりました。 このとき、 「平均生活満足度」と、「家族の人数」で、 相関をとればキレイに「-1」になるかと思います。 回帰曲線も、キレイな線が引けます。 ---------------------------- 【質問の本題】 ---------------------------- 質問の本題は、B.平均生活満足度×家族 の分析のほうになります。 B.の分析で、確かにキレイな数字は出てくるのですが、 こういった形で、分析をしてしまうと、 実際には、5000人のデータを取得しているにも関わらず、 300人ぐらいのデータでも、同じ平均が出てきたら同じ結果になってしまうかと思います。 それぞれのサンプル数が、500人いる場合とで、 サンプル数が10人いる場合とで、行うべき検定等の手法が異なってくるのではないかと思うのですが、 この場合、どのような処理を行うのが適切なのでしょうか。 ご指導お願い出きましたら幸いです。 よろしくお願いいたします。