卒論の統計処理:欠損値の扱いとは?

このQ&Aのポイント
  • 卒論の統計処理において、どのデータを扱い、どのデータを扱わないかについて検討する必要があります。
  • 例えば、100人のデータを取得し、その中で欠損値が存在する場合、欠損値の扱い方を決めることが重要です。
  • データの欠損値によって、分析結果や考察が変わる可能性があるため、適切な処理方法を選ぶ必要があります。
回答を見る
  • ベストアンサー

卒論 統計処理 欠損値の扱い

どのデータを扱って、どのデータを扱わないこととするかの区別について。 例えば100人のデータをとったとします。 それで、男女何人いるか人数を調べました。 で、年齢も調べようすると、 一人年齢を書いてない人がいました。 だから99人分の年齢の平均値であるとか、最小値を分析します。 そこで、質問ですが、例にもあげましたように年齢以外にも、 質問によってそれぞれ、一個、二個、三個というように、 ぬけているデータが存在するわけですが、 例えば、年齢は99人のデータを扱い、体重は98人のデータを扱い、身長は97人のデータを扱うということは 可能なのでしょうか? やはり、この中で一番データの欠損値があったのは、身長の97人であるから、 年齢や体重も統一して97人分のデータしか扱えないのでしょうか。 もし、全てのデータにおける人数を統一しようとするとせっかく他の質問には答えてもらっているのに、 その質問ひとつにちゃんと答えなかった人のでーたを丸ごとなかったことにしないといけないのですが。。。 やはり、人数は統一しないといけないのでしょうか。。。。。。 キーワード 心理学 統計学 数学 卒業論文 分析

質問者が選んだベストアンサー

  • ベストアンサー
  • ur2c
  • ベストアンサー率63% (264/416)
回答No.3

> 日本語でおすすめの本があれば 少し調べたらこれが出て来ました。私は読んでません。 岩崎学 不完全データの統計解析 エコノミスト社 2010

参考URL:
http://www.economist.co.jp/1_04_tokei/1_04_1_fukanzen.htm
pahonen
質問者

お礼

すばやい回答ありがとうございます。 参考にしてみたいと思います。

その他の回答 (2)

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.2

欠損値の扱いはいろいろ考えられていて、今では統計的にかなりうまく処理できます。やりかたは、たとえば参考 URL の本に書いてあります。日本語の本もあるはずです。missing data, data augmentation algorithms, imputation とかで検索してみてください。

参考URL:
http://www.amazon.com/Tools-Statistical-Inference-Exploration-Distributions/dp/0387946888
pahonen
質問者

お礼

ありがとうございます。 できれば日本語でおすすめの本があれば紹介していただきたいのですが。。。

noname#157574
noname#157574
回答No.1

人数を統一する必要はないと考えます。

pahonen
質問者

お礼

ありがとうございます。 しかし、何を根拠にそのようにおっしゃるのか知りたいです。。。

関連するQ&A

  • 卒論について。統計処理

    質問紙の統計処理を行っています。 教授は記述統計だけでもOKサインがでましたし、 論文として十分成り立つと言っていました。 大学院の人に聞いても論文として成り立つ、 ただし、内容が薄いと思われると聞きました。 でもこれまでの論文でも記述統計のみで出した人もいるから大丈夫といっていました。 そこで質問ですが、記述統計のみの論文は中身が薄くなってしまうのでしょうか。 もし、記述統計のみを使用しても、中身が濃くなるような書き方があるとすれば教えて下さい。 ここは、やはり自分の文章の書き方とか考え方次第で、内容がよくなったり 悪くなったりするのでしょうか キーワード 心理学 数学 卒業論文

  • 欠損値を分析ごとに排除することについて。

    時々、これまでの論文を見ていますと、 ほとんどのものは、無回答などを全て除いた質問紙のみを扱っていますが、 たまに、欠損値を分析ごとに排除した論文を見ます。 この方法どう思いますか。 やはり、質問ごとに欠損値の扱い方が違うということは、それだけ精密な結果は出にくくなると思いますか? キーワード 心理学 統計学 数学

  • 【統計処理】2群間の差の有無を調べるには?

    あるデータを収集し、その分析をしなくてはいけません。 SPSSを使用する予定ですが、どの分析方法がいいのかがわからないので教えてください。 ランダムにN=30のサンプルを2群に分けました。 属性が等質であることは確認しました。 介入群と対照群の2群に対して、 介入直前・直後・10分後・15分後・・・・30分後までリッカート尺度を測定しました。欠損値はありません。 介入群と対照群でそれぞれの時間で測定されたリッカート尺度に差があるのかどうかを調べたいと思っています。 統計がよくわからず、皆さんに教えていただけたらと思います。 よろしくお願いいたします。

  • エクセルでの統計処理について

    エクセルでの統計についての質問です。 母集団の年齢分布(人数+年代毎の割合)と サンプルの年齢分布(人数+年代毎の割合) があります。 (例) 年代/母集団/サンプル 10代以下 /100人 /30人 10代 /300人/ 45人 20代 /400人 /50人 ・ ・ ・ サンプルが母集団に対して、有意であるという ことを証明 or検定?するためにはどうしたらよいのでしょうか。 人数を使っても、年代毎の割合を使ってもどちらでも構いません。 エクセルで出来ることが希望です。 統計素人ですみません。 よろしくお願いします。

  • アンケート統計で弾いても良い回答

    ネット上でアンケート統計をとっているんですが、その中に「明らかにおかしい」と言えるような回答が混ざっていることがよくあります。 例えば、年齢が「0歳」になっていたり、身長が「10cm」になってたりするようなケースです。 こういう回答は統計分析の際に弾いても良いのでしょうか?

  • 統計、主成分分析について

     すいません。  勉強中の身なのですが、まだあまり理解度は低いと思われます。  統計学の主成分分析なのですが、  分析内容は  「グループ毎のデータを用意し、そのデータからグループ毎の違いを導き出すことができるか。つまりデータ→グループ分けをして元のグループのようになるか。」  で正しいでしょうか?    例えば、プロ野球選手を  身長、体重、握力、50m走タイム、遠投  などのデータを入れ、  を統計ソフトにかけ、  球団別にうまく分かれるか。  というのは主成分分析ですよね…?  また、上のような主成分分析を試行するのに  考えられる例はどのようなものがあるでしょうか?  データもあれば嬉しいのですが…。

  • 研究論文・統計ソフトについて

    ある研究をするとなると統計ソフトが必要になります。 統計ソフトをもたない場合、統計ソフトをもっている友人にデータをかして分析を依頼し、分析結果をおしえてもらうことは許されるのでしょうか?(ばれないだろうから、許されるとは思いますが。) また、「統計ソフト○○○を使用して、~検定を行った。」とまるで、自分自身が行ったように論文に記載していいですか?

  • 統計でカットオフ値を求める際の質問です

    統計のド素人なもので教えて下さい。 歯医者に通院している患者さんの身長や体重、年齢、歯の痛さの尺度の値など(合計15項目ぐらい)のデータを使って、虫歯の予後に関わる因子のカットオフ値、感度、特異度を求めたいと思います。 症例数が22人しかいませんが、この少人数のデータでこういった解析を行う意味はあるのでしょうか? もし症例数が足りないということであれば、最低何症例あれば可能なのでしょうか? よろしくお願いします。

  • 質問紙 回収後のチェック

    質問紙で回収したデータをパソコンに打ち込んだ後、何回ぐらい見直しましたか? 私は二回見なおしたのですが、どれぐらい見直したらよいのか分かりません。 エクセルやSPSSに打ち込んで、分析をしたときに 欠損値が出なければ間違いなくデータ入力できていたと判断してよろしいでしょうか? キーワード 心理学 統計学 数学 アンケート

  • 統計学的なアンケートの取り方

    統計学的なアンケートの取り方 キーボードのタイプ方法をいくつか用意してタイプミス率を計測する実験をしています。 その際どの程度の人数に調査を行えば信頼できるデータとなるか悩んでいます。 統計学的な上手い手法があれば教えてください。 出来ればそのアンケート方が詳しく書かれている論文等の文献も添えていただけると助かります。 どうかよろしくお願いいたします。