• 締切済み

統計の問題がわかりません。どうかわかる方いたらお願いします。

回帰分析を行うもの、独立変数を使って従属変数を求めるものがまとめのデータがあります。 その求める前に、全ての変数についての相関係数を出しています。 この相関係数のところからわかったところにはAとBとCの相関は高い、DとEの相関は低いなど書かれています。 独立変数や従属変数間の相関などはなにか高いと悪い、低いと駄目などがあるんでしょうか?

みんなの回答

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

こういうのは、やったことありますよ。 ある工場での ・ロット毎の不良率 x1,x2,x3,・・・ それに対する、 ・工程Aでの出来上がり寸法 a1,a2,a3,・・・ ・工程Bで装置Cを使ったか?  (使ったならば1,他の装置ならば0) b1,b2,b3,・・・ ・工程Cの時刻 c1,c2,c3,・・・ ・工程Dの作業者はEさんだったか?  (Eさんならば1、他の作業者ならば0) d1,d2,d3,・・・ そして、 ・xn と an の相関係数 ・xn と bn の相関係数 ・xn と cn の相関係数 ・xn と dn の相関係数 を求めます。 相関係数の絶対値が1に近いほど相関があります。 不良率を下げるには、 an との相関係数が1に近い → 寸法が小さくなるよう設定する an との相関係数が−1に近い → 寸法が大きくなるよう設定する bn との相関係数が1に近い → その装置の使用停止、あるいは能力改善 bn との相関係数が−1に近い → その装置を積極的に使う cn との相関係数が1に近い → 遅い時刻での作業を避ける。 cn との相関係数が−1に近い → 早い時刻での作業を避ける  さらに、なぜ時刻に関係するのかを原因究明し、対策を講じる。  (例えば、交替制24時間稼動の場合、明け方に作業ミスが多いとか) dn との相関係数が1に近い → その作業者を配置転換あるいは教育 dn との相関係数が−1に近い → (その作業者は優秀) なお、 分かりやすくするため、あまり現実的でない項目も、あえて書きました。

全文を見る
すると、全ての回答が全文表示されます。
  • kumipapa
  • ベストアンサー率55% (246/440)
回答No.1

ない。「悪い」、「駄目」ってそもそも何? 相関があるのかないのか、強いのか弱いのかを調べようというのが数学としての目的なわけで、その結果を見てどう考えるか(良し悪しなど)はそのデータの内容や分析の目的によるわけで、数学としては一切関係ない。 質問者の質問は、「f(x)の最大値と最小値を求めよという問題があるんですが、f(x)が高いと悪い、低いと駄目などがあるんでしょうか」と聞いているのと同じだと思いますけど。悪いとか駄目とかは、数学としては無関係。f(x)の内容を知っているあなたが決める事。 ってか、何を読んでるのか知りませんが、一体何のためにそれ読んでるんですか? 意味が全然分かってなくて読んでるようですが。

vaio02
質問者

お礼

まあ確かに知識は引くですね。 ただ、例えばボール投げの距離を測るのに握力、身長、体重で調べるとします。 その場合、体重と握力には相関が高いからだめだというのを見た事があります。 なので、これもなにか意味があるのかなぁとおもいました。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計 やはり以前の質問に疑問が・・・

    以前、重回帰分析についての従属変数と目的変数との関係について、疑問に思い、以下のような質問をしました。↓ 【重回帰分析の目的変数が、(A+B+C+D)というものとします。 A~Dは、数量データです。 説明変数にAやBなどが入っていたら、それはダメですか? 説明変数X(Aとか)が目的変数Y(A+B+C+D)の一部の構成要素だったら、Xを使って重回帰分析はやったらダメなのですか?】 答えとしては、【してもよい】と受け止めました。 しかし、独立変数が従属変数の一部だと関係が強すぎてこれはやってはダメと考えるべきだという人もいます。(一応統計のできる人が言ってました) そういわれたら、そう思います。YにA、B、C、Dなどは関連しているので、重回帰分析の独立変数にA、B、C、Dは使用してはダメだということです。 ・・・結局、何が正しいのかよくわかりません。もしよかったら、考えなど教えてください。

  • 相関関係と双方向因果関係

    どこのカテゴリーで質問しようか迷いましたが、ここでさせていただきます。 回帰分析を知ったときあたりからずっと不思議だったのですが、相関関係と双方向因果関係との違いって何ですか?私の言っていることは、以下のものの違いについてです。 ○相関関係とは…  二つの変数の相関係数をとったときに、有意な係数が出てくることです。 ○双方向因果関係とは…  二つの変数に対して、片方を独立変数、もう片方を従属変数として単回帰分析を行ったとき、有意な係数が出てきた場合、独立変数と従属変数を入れ替えて回帰分析したとしても有意な係数が出てくることです。 分かりにくいことがあれば補足要求をしてください。宜しくお願いします。

  • 影響の大きさを統計学的に計算する手法

    ある従属変数Yは,独立変数X1,X2,X3,X4に影響を受けると考えられているとします.このとき,各独立変数が従属変数の変化にどの程度影響を与えているかを調べる方法は,重相関解析で,Y=a*X1+b*X2+c*X3+d*X4という式をつくり,係数a,b,c,dの大小を比較するといった方法がとられるかと思いますが,この際,従属変数Yの変動に有意な影響を与えていない独立変数があるかどうかをチェックする方法はありますか? 計算の仕方は参考書をあたりますので,「何々分析をすればいい」というところまででも教えていただけませんでしょうか?

  • 1変数と複数の変数の相関をみるには

    1変数と複数の変数、例えば、「変数a」と「変数b、c、d」の相関関係をみるにはどうすればよいでしょうか? 重回帰分析でもみれますでしょうか? 重回帰分析は、説明変数で目的変数を予測することができるかどうかを分析することだと思いますが、得られた重相関係数と、同時に行う分散分析のP値によって、相関関係の強さをみれるのではないかと思うのです。 最終的には、「変数a」と「変数b、c、d」は"有意"に相関があるといたいのですが、重回帰分析の場合、説明変数と目的変数の方向性の問題もあるので「変数a」⇔「変数b、c、d」とは言えないのでは…と悩んでいます。 「変数b、c、d」を主成分分析で合成してから相関分析をすれば…などいろいろ考えているのですが、分析の精度としてそれでいいのか分かりません。 何卒、アドバイスよろしくお願いします。

  • 統計学の課題で困っています

          A  B 北海道   5.5  4.7 青森    4.5  4.7 岩手    4   4.1 というA,B二つのデータがあるとき 1、2つのデータをそれぞれ標準化しなさい。 2、2つのデータ間の共分散を求めなさい。 3、標準化した2つのデータ間の共分散を求めなさい。 4、一方のデータを説明変数、他方のデータを被説明変数とする回帰式と決定係数を求めなさい。また、被説明変数の理論値と残差を求めなさい。 5、上記2及び4の計算結果について、標準化、共分散、相関係数の意味を説明しつつ、分析・考察を加えなさい。 6、回帰式を求める際の基本的考え方と決定係数の意味を説明しつつ、計算して得られた回帰式、決定係数について分析と考察を加えなさい。 7、残差において正または負の大きな値が出た地域について、なぜそのように大きな値が出たと考えられるか、地域の特徴を考慮しつつ思いつくことを述べなさい。 という課題が出された時どのようにして解けばいいのですか?

  • SPSSと標準偏回帰係数

    SPSSの重回帰分析で悩んでいます。解る方がいたら教えてください。データから、従属変数を決定し、独立変数も決定しましたが、標準偏回帰係数の求め方が解りません。違った表現なのかもしれませんが、知識が明るくないので解りません。また、その操作法も教えていただければありがたいです。お願いします。

  • 統計おしえて!ロジスティック回帰でいいのかな?

    10項目程度の質問項目があります。 すべて、YES、NOで答えるタイプの項目です。(質的なデータで二値性) そのうち、ある一つの項目を従属変数(目的変数)としてほかの項目を独立変数として多変量解析したいのですが。。。 「ロジスティック回帰」を使えばいいのですか? 各独立変数ごとに従属変数に対するオッズ比が算出されるのですか? あと、これも重回帰のように独立変数の選択問題で当てはまりがよくないモデルがあったりするのでしょうか? あと、ロジスティック回帰を行いたいのですがソフトがなくて・・・ 無料でできるフリーソフト(初心者でもわかりやすい)とかあったら紹介してください。 たくさん質問してすみません。どれか一つでもわかるところがありましたら教えてください。お願いします。

  • 独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさ

    独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさを知りたいのですが、以下のどちらの方法を適用すればよいのでしょうか。つまり、個々の独立変数ごとに従属変数の変動に占める影響割合(%)を知りたいのです。 第一の方法は、重回帰分析を行い、その偏回帰係数を標準化して(つまり、標準偏回帰係数)、その標準偏回帰係数の大きさによって、影響の大きさを比較する。 第二の方法は、分散分析のうち一般線形モデルを使用する方法です。ここで一般線形モデルとは、私が使用している統計ソフトの定義によると、独立変数としてカテゴリーデータと計量データを同時にモデルに含めることができます(ただし、モデルに含める計量データはcovariatesとして指定することになっています)。 この方法でアプローチした場合、従属変数の全変動(つまり平方和)を独立変数ごとに分解するので、その(平方和の)比率で影響の大きさを比較できます。 実際の例(カテゴリーデータと計量データを含む)を使って、上述のふたつの方法で計算してみたところ、異なる値になってしまいました。結局、どちらが正しいのかわかりません。 よろしくお願いします。

  • 統計の選び方について

    卒業論文で質問紙による調査を行ったのですが、専門書を見ると「統計の種類」が多すぎて、どの統計を使用すればよいのかわかりません。 研究は尺度を2つ使用し(この尺度間での独立変数-従属変数の関係は成り立たない)、個人の属性(5つ)をきいて、すべてが独立変数、従属変数になる計画です。 今、とりあえず使用している、分析は1つずつ独立変数、従属変数を変えて、分散分析を行っていますが、よく考えたら、これをすべての組み合わせでやろうとすると気の遠くなる作業…ですね(@o@) 統計に詳しい方がいらっしゃれば、できない大学生の私に教えてください(/_;)ナサケナイデス

  • 心理学統計的、独立変数と従属変数について。

    現在私は、二つの尺度の質問紙を配り、尺度ごとに因子分析した後、これらを独立変数と従属変数にして関連性を見るという事をしています。 ですが、サンプルデータを取り終わった後、何をすればいいのかわかりません。 因子分析と重回帰分析が必要なのはわかるんですが、重回帰分析はどの時点でやるのか、更に他にやるべき操作があるのかわかりません。 出来ればわかりやすく回答して頂けるとありがたいです。 よろしくお願いします。