以前のコンテンツからこの例を思い出してください:
統計学の学生11人の無作為抽出から次のデータが出ました、
xは80人中3番目の試験の得点、yは200人中最後の試験の得点です。 3回目の試験の点数がわかっている場合、ランダムな学生の最終試験の点数を予測することができるか?
x(3回目の試験の点数) | y(最終試験の点数) |
---|---|
65 | 175 |
67 | |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
第3回試験の得点をもとにした期末試験の得点を示した表です。
3 回目の試験のスコアに基づいて最終試験のスコアを示す散布図
私たちは散布図を調べ、相関係数が有意であることを示しました。 第3回試験の成績の関数としての最終試験の成績の最良適合直線の方程式を求めた。 4287><991>3回目の試験で73点を取った統計学の学生の最終試験の平均点を推定したい、または予測したいとします。 試験の点数(x値)は65から75の範囲である。 73はx値65と75の間にあるので、x = 73を式に代入する。 Then:
displaystylehat{{y}}=-{173.51}+{4.83}{({73})}={179.08}
我々は、第3回試験で73の成績を得た統計学の学生は、平均的に最終試験で179.08の成績を得るだろうと予測している。
例題
上のデータを使ってこの例題を考えてみましょう:
- 3回目の試験で66点を取った学生の最終試験の成績はどうなると予測しますか。
- 3回目の試験で90点を取った学生の最終試験の点数はどうなると予測しますか?
解答:
- 145.27
- データのx値は65から75の間である。 90はデータ(独立変数)で観測されたx値の領域外なので、この生徒の期末テストの点数を確実に予測することはできません。 (xの式に90を入力して対応するyの値を計算することは可能ですが、得られるyの値は信頼できません。) データで観測されたxの値以外での予測がいかに信頼できないかを理解するために、式にx=90を代入してみましょう。
注
データで観測されたx値の内側を予測することを内挿といいます。
try it
週に何時間楽器を練習しているか、数学のテストの点数はどうか、などのデータを集めました。 4287>
週に5時間楽器を練習している生徒の数学のテストの点数は何点だと予測しますか。
データ:米国疾病対策予防センター
データ:米国HIV/STD/TB予防センター
データ:米国国勢調査局より。 3753>
Data from the National Center for Health Statistics.
Concept Review
強い相関係数の存在を判断し、最適な直線を計算したら、最小二乗回帰線を使ってデータについて予測することができる
。