• 締切済み

統計-回帰分析 最小二乗法 使用方法について

ある試験の得点分析を依頼されたのですが、統計学の回帰分析の正しい使用法がわからず困っております。 そこで皆様の知識をお借りしようと思った次第です。 10万人が受験している100点満点の試験(A)と、5千人が受験している100点満点の試験(B)があります。 試験(B)を受験している生徒の80%が試験(A)を受験しています。 試験(B)は難易度が高い問題と難易度が普通の問題の2種類が用意されており、試験(A)での中~高得点層が難易度の高い問題を、低~中得点層が難易度の普通の問題を選択しています。 試験(B)の精度を試験(A)の精度に近づけるために、試験(A)(B)両方の試験を受験した生徒を対象に最小二乗法で試験(B)を試験(A)に換算しようしました。 その結果、試験(B)の難易度高の換算SSと難易度中の換算SSは、近似値になるのかなと思っていたのですが、大きく異なります。 やはり、100点満点という限界値があると高得点層は頭打ちしてしまい正しい結果が得られないのでしょうか? それとも換算の仕方が間違っているのでしょうか。 そもそも、そのような事はできないのでしょうか。 よろしくお願いいたします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

SSという単語が出てきますが、不勉強でしりません。その単語を使って考える必要性を感じませんので、理解できない点が多いのですか >誤差というには差が大きく、平均SSでの得点差は11(300満点で)もありました。 300点満点で11点なら、4%未満。大したことは無い、とも言えますが。 >B1切片係数:32.1729116315614 B1X値係数:0.546605341463663 B2切片係数:10.9904071287823 B2X値係数:0.672136632625494 全てのデータを一つの散布図で図示し、貼付けてもらえないと、文字だけでは困難です。 1) B1(円)とA(ドル)との回帰式から、B1を代入しAの値に換算する。 そして、B1とAの値を散布図に○でブロットする。 2) B2(元)とA(ドル)との回忌式に、B2の値を代入してAの値換算する そして、B2とAの値を同じ散布図上に□でブロットする。 その散布図を見て、考えて下さい。 文字のやり取りでは無理です。散布図を写真にし、貼付けて見せて下さい。ただ、それは仕事上の秘密の漏洩に繋がるので、慎重に対処して下さい。  回帰係数や切片に差がありそうに見えますが、1本の線を引いてもそれほど差は無いような予感がしますが。  ○と□の全ての近く通る線(=回帰式)が引けるようなら、解決です。 引けないのなら、テストの試験が不適である可能性が高い。  回帰分析は正規分布を前提としているので、試験の正答率が正規分布していないと、不適になることが多い。この場合気になるのは、B1とB2でグループ分けしているので、Aの得点分布は正規分布しにくい懸念がありますので・・・。 ともかく、散布図を作り、よく考えて下さい。繰り返しになりますが、文字のやり取りでは、無理です。

raku1234
質問者

お礼

ご回答ありがとうございます。 >300点満点で11点なら、4%未満。大したことは無い、とも言えますが。 よく考えてみれば、このぐらいの誤差は最小二乗法を使用している限り仕方が無いことなのかもしれません。散布図でも見てみましたが、B1とB2では分布する位置が違えど一次関数の通る線はほぼ同じラインを描いています。 もう少し、よく考えてみたいと思います。 kgu-2様のご返信で、分析する方向性を見つけれたと思います。 (また、悩んでしまいご協力をお願いすることがると思いますが、) いろいろありがとうございました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

一番簡単なのは、B1とB2の両方を受けた人のみで回帰式を得れば十分。   これが出来ないようなので私には下記の方法のみ  B1(円)とA(ドル)との回帰式から、B1を代入しAの値に換算する  B2(元)とA(ドル)との回忌式に、B2の値を代入してAの値換算する  換算したB1とB2の回帰式を求めれば、これがB1とB2の関係式になります。 すなわち、Aを仲介して、B1(円)-A(ドル)-B2(元)の関係からAを外せば、B1とB2の関係が回帰式として表せます。    ただそれぞれの回帰式の決定係数(r^2)が、0.6は欲しい。これが小さいと、回帰式の信頼性が薄れて、誤差が大きくなります。  それでも問題が残ります。B1とB2が重なっている領域は、それぞれの回帰式でB1では低い人、B2では高い人であり、回帰式は中心から離れた領域では信頼性が激減します。  重なった領域が無い直線を繋ぎ合わせて使っていますので、直線のハズが繋いだ点で曲がってしまっているのが誤差の原因かもしれません。

raku1234
質問者

補足

kgu-2様、ご返信ありがとうございます。 >Aを仲介して、B1(円)-A(ドル)-B2(元)の関係 この方法に関しては、合っているようです。 しかし、 >Aを外せば、B1とB2の関係が回帰式として表せます。 この部分は、知識不足のためどうやったら良いのかわからないのです。 excelを用いて決定係数R2を調べるとB1、B2ともに0.8でした。 ここで、仮にB1とB2が全く同じ試験内容であった場合のデータも存在しますので、そのデータでも分析してみました。 B1とB2の試験内容が同じ(受験しているレベルの層はB1>B2)で、B1とB2両方を受験はできないとします。300点満点の試験です。 【結果】 B1、B2ともに決定係数R2は、0.8でした。 B1切片係数:32.1729116315614 B1X値係数:0.546605341463663 B2切片係数:10.9904071287823 B2X値係数:0.672136632625494 手段は、B1集団のSSとB1を受験した生徒がAを受験したときのSSから切片傾きを求めています。B2も同様です。 予測では、同じ試験内容を受験した得点データなのだから、 B1集団をAに換算した平均SSの得点と B2集団をAに換算した平均SSの得点はほぼ一致するのかと考えました。 しかし、誤差というには差が大きく、平均SSでの得点差は11(300満点で)もありました。 やはり、 >Aを外せば、B1とB2の関係が回帰式として表せます。 の部分が重要なのでしょうか。 そもそも要素が足りてないのでしょうか。 答えが、「一致する」する方向で分析するべきなのか 「一致しない」方向で分析するべきなのかもわからなくなっています。 申し訳ございませんが、進むべき方向を正して頂けないでしょうか。 お手数をおかけしましてすいません。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

 事実を長々と述べられていますが、混乱の元。回帰分析用に整理されていないからです。枝葉は、切り取って、どの情報が必要か、どのように処理すればよいか、と考えてください。目的を正確にとらえれば、正答に辿りつくのは容易です。わざわざ難しくして、道に迷う必要はありません。 整理すると  BはB1とB2の2種類あり、Aは1種類。B1とB2の関係式を知りたい、ということで合っていますか。これは、B(B1かB2)とAを受けた人が十分な人数いれば、関係式(=回帰式)は簡単に導けます。  最も簡単なのは、B1とB2の両方を受けた人が必要数あること。ないのなら、基本的な統計学的な誤りです。   また、研究のためですか、仕事ですが、まさか趣味。

raku1234
質問者

お礼

ご返信ありがとうございます。 仕事の都合で必要になってしまったといった感じです。。。 ご教授いただければ幸いです。 人数に関してですが、 A:10万人 B1(難):3千人 B2(易):2千人 です。 Bを受験した生徒のほとんどがAを受験したと仮定します。 Aを基にB1を換算した結果と、Aを基にB2を換算した結果の関係が 異なる理由を突き止めたいのです。 B1とB2はどちらかしか受験できない選択式の問題です。 ご指摘の「B1とB2の両方を受けた」という部分を、 「B1とB2の生徒が両方受けたA」から求められればと考えました。 それにより、異なる試験もあたかも同じ試験を受けたように換算された SSが求められるのではないかと。 どのように求めるのが正しいのでしょうか。 そもそも情報が足りてないのでしょうか。 よろしくお願いいたします。

関連するQ&A

  • 分母が異なる時の平均点の求め方

    20点満点の試験Aと80点満点の試験Bを合わせた100点満点の試験があります。試験Aの平均得点率が70%で試験Bの平均得点率がX%の時、最終得点率は100点満点中80%でした。 この時のXの値を求めたいのですが、そもそもこれだけの情報で試験Bの平均得点率Xを導くことができるのでしょうか。 算数が苦手なのでご指導ご鞭撻の程よろしくお願いします。

  • 満点の異なるテストの相関分析

    統計初心者です。ご教授をお願いいたします。 満点の異なる三つのテストの相関関係を見たいと 思っています。(例えば, テストA・・・30点満点で平均得点は25点, テストB・・・50点満点で平均得点は30点, テストC・・・70点満点で平均得点は65点) このような場合,以下の内のどの方法で相関分析を することが望ましいのでしょうか。 (1)テスト得点をパーセンテージ化して分析 (2)テスト得点をz得点化して分析 (3)テスト得点のまま分析 望ましいのは,(1)か(2)かと思っているのですが…。 なお,分析に使用する統計ソフトは,SPSS(Ver.17)です。 どうぞよろしくお願いいたします。

  • 最小二乗法

    n組のデータ (xi, yi) を,特定点(X0, Y0) を通る直線 y = ax+b でフィッティングしたい。最小二乗法で係数a,bを求めるため の式を導きなさい。 という問題で 各データの残差を二乗した和が最小になるときのa,bを求めるのですが 特定点(X0,Y0)を通るにはどうすればよいでしょうか? ただ単に、特定点を通らずフィッティングするやりかたはわかるのですが・・・。 よろしくお願いします。

  • 偏差値換算得点・・・?

    こんにちわ。 先日私は中央大学を一般試験で受験しました。 赤本に書いてある近年の合格最低点が例年230点前後なのですが、それは全て「偏差値換算得点」というものなんです。 この偏差値換算得点というものは、選択科目の平均点が絡んでくるんですよね? そうすると、素点で230点を超えていても偏差値換算されると下回ってしまう可能性があるということでしょうか・・・。 ちなみに私の素点(概算)+例年比難易度は 英語・・・100/150(例年より易しめ) 国語・・・75/100(難易度変わらず) 政経・・・75/100(例年より難) ↑こんな感じです。 一応250(少なくとも240)は取れているようなのですが・・・正直いって心配してます。 ご回答よろしくお願いします。

  • 第19回社会福祉士国家試験の合格ラインについて

    1月28日に第19回社会福祉士国家試験を受験しました。各社が提供している解答速報を基に自己採点したところ105点あたりでした。厚生労働省は,合格基準は6割程度で,問題の難易度で補正を行うとしています。6割なら150点満点なので90点がボーダーになります。ここで心配なのは得点の補正で合格基準が90点より跳ね上がることです。過年度の実際の合格得点はいくつだったのかが分かりません。知っていらっしゃる方いましたら,お知らせください。また,第19回の難易度から見て,今回の試験の合格ラインは何点ほどになるのか,予想ができる方いるようでしたらお教えください。よろしくお願いいたします。

  • 心理学統計の分析方法についての質問です。

    〔至急、お願いします。〕 「Aが高いものは、Cが低くなる。しかしAが高いものでもBが低くなれば、Cは高くなる」といった仮説をたてました。 そこで、A高B高、A高B低、A低B高、A低B低の四群を独立変数、Cを従属変数として、1要因4水準の分散分析を行ったのち、 Aが高い者のみBがCに負の寄与を及ぼしており、Aが低い者はBがCに寄与していない。そしてAはBに正の寄与を及ぼしている。という重回帰分析を行おうと思っています。 わからない点があります。 重回帰分析がどういうものなのかはざっくりと理解できていますが、実際に行ったことはなく、Aが高い者と低い者で群分けした上で分析することは可能なのでしょうか。 また、統計の知識が不十分であり、ツールなどを利用して行ったこともわずかしかないので、これで実際に分析が出来て、結果を得られるかどうかも自信を持てません。 どうかお力添えをお願いいたします。

  • 大学がセンター試験の得点を傾斜換算する際の計算ルールは?

    高3の息子の通う高校から、センター試験受験者の自己採点に基づく2つの予備校のデータ分析結果が配られました。何れもセンター試験の得点を、志望校の教科別配点に合わせた得点に傾斜換算した上で分析されているのですが、ここでひとつ気になったことがあります。それは、得点の換算に際して、各教科別に小数第1位を四捨五入して整数で算出していることです。これでは、1点を争う受験のデータ分析としては正確さを欠くように思えてならないのですが、 (1)実際にセンター試験の結果を利用する大学側の計算ルールはどうなっているのでしょうか? (2)予備校がこうした方法で分析するのは、分析時間の短縮とコスト削減のためなのでしょうか? たとえば、理系の国立5教科7科目型の受験(900点満点)で、センター試験の教科別得点が、国語151/200、数学151/200、外国語151/200、地歴75/100、理科151/200の合計679/900(得点率75.44%)、志望校の配点合計が450点の場合を想定すると、 小数第1位まで計算した場合には、国語75.5/100、数学75.5/100、外国語75.5/100、地歴37.5/50、理科75.5/100の合計339.5/450(75.44%)となるところ、 小数第1位を四捨五入した場合には、国語76/100、数学76/100、外国語76/100、地歴38/50、理科76/100の合計342/450(76.00%)となってしまいます。これは、センター試験で国語152/200、数学152/200、外国語152/200、地歴76/100、理科152/200の合計684/900(76.00%)をとった場合と全く同じ分析結果が出ることになってしまいます。

  • 最小二乗法について(統計学の回帰分析)

    「残差」と「回帰直線上の従属変数値から従属変数の平均値を引いた値」との共分散がゼロになるのは何故ですか?

  • アンケートの分析方法を教えてください。

    アンケートの分析方法を教えてください。 添付のようなアンケート結果の場合、以下どちらの集計の方が適していますか? (1)テーマA:1位25pt+2位29pt+3位17pt=71ptを得点として順位を出す (2)テーマA:(1位25pt*5点)+(2位29pt*3点)+(3位17pt*1点)=229ptを得点として順位を出す 他に適した分析方法があればご教示頂けますと幸いです。

  • 重回帰分析について(緊急)

    重回帰分析について.(緊急) 大学で近赤外スペクトル法を用いた研究をやっています. 解析方法にはPLS回帰分析を使用しており,目的変数を熱電対の温度T,説明変数を各波長の吸光度差スペクトルΔAでとっています. 現在,上記の研究を分光器ではなく近赤外線カメラで行おうと考えています. しかしながら,近赤外線カメラは分光器のように各波長の吸光度差スペクトルΔAを出すことができません(1920nmのΔAのみ). 単回帰分析に変更しようと思っていますが,参考書などを読む限り精度は,単回帰分析<重回帰分析<PLS回帰分析のような気がしてなりません. そこで質問です. ・説明変数は波長1920nmのΔA(以下ΔA(1920))しかありませんが,ΔA(1920)の関数である光強度Iを無理やり説目変数に入れ,重回帰分析を行うことはできるのか?(説明変数に使われている変数の関数をしようすることはできるのか?) ・上記のように説明変数の因子が一つしかない場合でもPLS回帰分析を行うことはできるのか? 以上です.今年から上記の研究を始めたので勉強不足な点もあるかとは思いますがどなたか教えてください. よろしくお願いします.