Výstupy z učení
- Použijte interpolaci a extrapolaci
Připomeňte si tento příklad z dřívějšího obsahu:
Náhodný vzorek 11 studentů statistiky poskytl následující údaje, kde
x je výsledek třetí zkoušky z 80 a y je výsledek závěrečné zkoušky z 200 bodů. Můžete předpovědět výsledek závěrečné zkoušky náhodného studenta, pokud znáte výsledek třetí zkoušky?
x (výsledek třetí zkoušky) | y (výsledek závěrečné zkoušky) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
Tabulka zobrazující výsledky závěrečné zkoušky na základě výsledků ze třetí zkoušky.
Rozptylový graf zobrazující skóre závěrečné zkoušky na základě skóre ze třetí zkoušky.
Zkoumali jsme rozptylový graf a ukázalo se, že korelační koeficient je významný. Zjistili jsme rovnici nejlépe odpovídající přímce pro hodnocení závěrečné zkoušky v závislosti na hodnocení ze třetí zkoušky. Nyní můžeme pro předpověď použít regresní přímku nejmenších čtverců.
Předpokládejme, že chcete odhadnout nebo předpovědět průměrnou známku u závěrečné zkoušky studentů statistiky, kteří na třetí zkoušce získali 73 bodů. Výsledky zkoušek (hodnoty x) se pohybují v rozmezí od 65 do 75 bodů. Protože 73 leží mezi hodnotami x 65 a 75, dosaďte do rovnice x = 73. Potom:
\displaystyle\hat{{y}}=-{173,51}+{4,83}{({73})}={179,08}
Předpovídáme, že studenti statistiky, kteří u třetí zkoušky získali známku 73, získají u závěrečné zkoušky v průměru známku 179,08. V případě, že u závěrečné zkoušky získají známku 73, budou mít průměrnou známku 179,08.
Příklad
Využijte výše uvedené údaje pro tento příklad:
- Jaký byste předpověděli výsledek závěrečné zkoušky pro studenta, který ze třetí zkoušky získal 66 bodů?
- Jaký výsledek závěrečné zkoušky byste předpověděli studentovi, který ze třetí zkoušky získal 90 bodů?“
Řešení:
- 145,27
- Hodnoty x v datech se pohybují v rozmezí od 65 do 75. Devadesát je mimo obor pozorovaných hodnot x v datech (nezávislá proměnná), takže nelze spolehlivě předpovědět výsledek závěrečné zkoušky tohoto studenta. (I když je možné do rovnice pro x dosadit 90 a vypočítat odpovídající hodnotu y, hodnota y, kterou získáte, nebude spolehlivá.)Abyste skutečně pochopili, jak nespolehlivá může být předpověď mimo pozorované hodnoty x pozorované v datech, dosaďte do rovnice x= 90.\displaystyle\hat{{y}}=-{173,51}+{4,83}{({90})}={261,19}Skóre závěrečné zkoušky je předpovězeno na 261,19 bodů. Největší výsledek závěrečné zkoušky může být 200.
Poznámka
Proces předpovídání uvnitř pozorovaných hodnot x zjištěných v datech se nazývá interpolace. Proces předpovídání vně pozorovaných hodnot x pozorovaných v datech se nazývá extrapolace.
zkuste to
Sbírají se údaje o vztahu mezi počtem hodin týdně cvičení na hudební nástroj a výsledky v testu z matematiky. Přímka nejlepší shody je následující:
\displaystyle\hat{{y}}={72,5}+{2,8}{x}
Jaký výsledek v matematickém testu byste předpověděli u studenta, který cvičí na hudební nástroj pět hodin týdně?
Údaje Centra pro kontrolu a prevenci nemocí.
Údaje Národního centra pro prevenci HIV, pohlavních chorob a tuberkulózy.
Údaje Úřadu pro sčítání lidu Spojených států amerických. Dostupné online na adrese http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Data z Národního centra pro zdravotní statistiku.
Přehled pojmů
Po zjištění přítomnosti silného korelačního koeficientu a výpočtu přímky nejlepší shody můžete použít regresní přímku nejmenších čtverců k předpovědím o vašich datech.