Wyniki nauczania
- Użyj interpolacji i ekstrapolacji
Przypomnij sobie ten przykład z wcześniejszych treści:
Losowa próba 11 studentów statystyki dała następujące dane, gdzie
x jest wynikiem trzeciego egzaminu z 80, a y jest wynikiem egzaminu końcowego z 200. Czy można przewidzieć wynik egzaminu końcowego przypadkowego studenta, jeśli znamy wynik trzeciego egzaminu?
x (wynik trzeciego egzaminu) | y (wynik egzaminu końcowego) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
Tabela przedstawiająca wyniki na egzaminie końcowym na podstawie wyników z trzeciego egzaminu.
Wykres rozrzutu przedstawiający wyniki na egzaminie końcowym w oparciu o wyniki z trzeciego egzaminu.
Zbadaliśmy wykres rozrzutu i wykazaliśmy, że współczynnik korelacji jest znaczący. Znaleźliśmy równanie najlepiej dopasowanej linii dla oceny z egzaminu końcowego jako funkcji oceny z trzeciego egzaminu. Możemy teraz użyć linii regresji najmniejszych kwadratów do przewidywania.
Załóżmy, że chcesz oszacować, lub przewidzieć, średni wynik egzaminu końcowego studentów statystyki, którzy otrzymali 73 na trzecim egzaminie. Wyniki egzaminów (wartości x) wahają się od 65 do 75. Ponieważ 73 znajduje się pomiędzy wartościami x 65 i 75, podstaw x = 73 do równania. Wtedy:
Przewidujemy, że studenci statystyki, którzy na trzecim egzaminie otrzymali ocenę 73, na egzaminie końcowym otrzymają średnio ocenę 179,08.
Przykład
Użyj powyższych danych dla następującego przykładu:
- Jaki byłby przewidywany wynik egzaminu końcowego dla studenta, który uzyskał 66 punktów na trzecim egzaminie?
- Jaki wynik egzaminu końcowego można przewidzieć dla studenta, który uzyskał 90 punktów na trzecim egzaminie?
Rozwiązanie:
- 145.27
- Wartości x w danych zawierają się w przedziale od 65 do 75. Dziewięćdziesiąt jest poza zakresem obserwowanych wartości x w danych (zmienna niezależna), więc nie można wiarygodnie przewidzieć wyniku egzaminu końcowego dla tego studenta. (Nawet jeśli możliwe jest wprowadzenie 90 do równania dla x i obliczenie odpowiadającej mu wartości y, wartość y, którą otrzymasz, nie będzie wiarygodna.)Aby naprawdę zrozumieć, jak niewiarygodna może być prognoza poza obserwowanymi wartościami x w danych, dokonaj podstawienia x= 90 do równania.\NPrzewidywany wynik egzaminu końcowego wynosi 261,19. The largest the final-exam score can be 200.
Note
Proces przewidywania wewnątrz obserwowanych wartości x zaobserwowanych w danych nazywamy interpolacją. Proces przewidywania poza obserwowanymi wartościami x zaobserwowanymi w danych nazywa się ekstrapolacją.
try it
Zbierane są dane dotyczące związku między liczbą godzin tygodniowo ćwiczących na instrumencie muzycznym a wynikami na teście matematycznym. Linia najlepszego dopasowania jest następująca:
jak można przewidzieć wynik testu z matematyki dla ucznia, który ćwiczy na instrumencie muzycznym przez pięć godzin tygodniowo?
Dane z Centers for Disease Control and Prevention.
Dane z National Center for HIV, STD, and TB Prevention.
Dane z United States Census Bureau. Dostępne online pod adresem http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Dane z National Center for Health Statistics.
Przegląd koncepcji
Po określeniu obecności silnego współczynnika korelacji i obliczeniu linii najlepszego dopasowania można użyć linii regresji najmniejszych kwadratów, aby dokonać przewidywań dotyczących danych.
.