Lernergebnisse
- Verwenden Sie Interpolation und Extrapolation
Erinnern Sie sich an dieses Beispiel aus dem früheren Inhalt:
Eine Zufallsstichprobe von 11 Statistikstudenten ergab die folgenden Daten, wobei
x die dritte Prüfungsnote von 80 und y die letzte Prüfungsnote von 200 ist. Können Sie das Ergebnis der Abschlussprüfung eines Zufallsstudenten vorhersagen, wenn Sie das Ergebnis der dritten Prüfung kennen?
x (Ergebnis der dritten Prüfung) | y (Ergebnis der letzten Prüfung) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
Tabelle mit den Ergebnissen der Abschlussprüfung auf der Grundlage der Ergebnisse der dritten Prüfung.
Streudiagramm, das die Ergebnisse der Abschlussprüfung auf der Grundlage der Ergebnisse der dritten Prüfung zeigt.
Wir haben das Streudiagramm untersucht und festgestellt, dass der Korrelationskoeffizient signifikant ist. Wir haben die Gleichung der Best-Fit-Linie für die Note der Abschlussprüfung in Abhängigkeit von der Note der dritten Prüfung gefunden. Wir können nun die Regressionsgerade nach der Methode der kleinsten Quadrate für die Vorhersage verwenden.
Angenommen, Sie möchten die mittlere Abschlussprüfungsnote der Statistikstudenten schätzen oder vorhersagen, die in der dritten Prüfung 73 Punkte erhalten haben. Die Prüfungsergebnisse (x-Werte) reichen von 65 bis 75. Da 73 zwischen den x-Werten 65 und 75 liegt, setzen Sie x = 73 in die Gleichung ein. Dann:
\displaystyle\hat{{y}}=-{173.51}+{4.83}{({73})}={179.08}
Wir sagen voraus, dass Statistikstudenten, die in der dritten Prüfung eine Note von 73 erreichen, in der Abschlussprüfung im Durchschnitt eine Note von 179.08 erreichen werden.
Beispiel
Verwenden Sie die obigen Daten für dieses Beispiel:
- Was würden Sie für die Abschlussprüfung eines Studenten vorhersagen, der in der dritten Prüfung eine 66 erreicht hat?
- Was würden Sie für die Abschlussprüfung eines Schülers vorhersagen, der in der dritten Prüfung 90 Punkte erreicht hat?
Lösung:
- 145.27
- Die x-Werte in den Daten liegen zwischen 65 und 75. Neunzig liegt außerhalb des Bereichs der beobachteten x-Werte in den Daten (unabhängige Variable), so dass Sie das Ergebnis der Abschlussprüfung für diesen Schüler nicht zuverlässig vorhersagen können. (Auch wenn es möglich ist, 90 in die Gleichung für x einzusetzen und einen entsprechenden y-Wert zu berechnen, ist der erhaltene y-Wert nicht zuverlässig.)Um zu verstehen, wie unzuverlässig die Vorhersage außerhalb der beobachteten x-Werte in den Daten sein kann, setzen Sie x= 90 in die Gleichung ein.\displaystyle\hat{{y}}=-{173.51}+{4.83}{({90})}={261.19}Die Vorhersage für die Abschlussprüfung lautet 261.19. Der größte Wert, den die Endnote erreichen kann, ist 200.
Anmerkung
Der Prozess der Vorhersage innerhalb der beobachteten x-Werte, die in den Daten beobachtet wurden, wird Interpolation genannt. Der Prozess der Vorhersage außerhalb der in den Daten beobachteten x-Werte wird als Extrapolation bezeichnet.
Versuch
Es werden Daten über die Beziehung zwischen der Anzahl der Stunden pro Woche, in denen ein Musikinstrument geübt wird, und den Ergebnissen eines Mathe-Tests gesammelt. Die Linie der besten Anpassung lautet wie folgt:
\displaystyle\hat{{y}}={72.5}+{2.8}{x}
Was würden Sie vorhersagen, wie die Punktzahl eines Schülers, der fünf Stunden pro Woche ein Musikinstrument übt, in einem Mathetest ausfallen würde?
Daten von den Centers for Disease Control and Prevention.
Daten vom National Center for HIV, STD, and TB Prevention.
Daten vom United States Census Bureau. Online verfügbar unter http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Daten vom National Center for Health Statistics.
Konzeptüberprüfung
Nachdem Sie das Vorhandensein eines starken Korrelationskoeffizienten festgestellt und die Linie der besten Anpassung berechnet haben, können Sie die Regressionslinie der kleinsten Quadrate verwenden, um Vorhersagen über Ihre Daten zu treffen.