Výstupy z učení

  • Použijte interpolaci a extrapolaci

Připomeňte si tento příklad z dřívějšího obsahu:

Náhodný vzorek 11 studentů statistiky poskytl následující údaje, kde
x je výsledek třetí zkoušky z 80 a y je výsledek závěrečné zkoušky z 200 bodů. Můžete předpovědět výsledek závěrečné zkoušky náhodného studenta, pokud znáte výsledek třetí zkoušky?

.

x (výsledek třetí zkoušky) y (výsledek závěrečné zkoušky)
65 175
67 133
71 185
71 163
66 126
75 198
67 153
70 163
71 159
69 151
69 159

Tabulka zobrazující výsledky závěrečné zkoušky na základě výsledků ze třetí zkoušky.

Toto je graf rozptylu poskytnutých údajů. Na ose x je vyneseno skóre ze třetí zkoušky a na ose y je vyneseno skóre ze závěrečné zkoušky. Body tvoří silný, kladný, lineární vzorec.Rozptylový graf zobrazující skóre závěrečné zkoušky na základě skóre ze třetí zkoušky.

Zkoumali jsme rozptylový graf a ukázalo se, že korelační koeficient je významný. Zjistili jsme rovnici nejlépe odpovídající přímce pro hodnocení závěrečné zkoušky v závislosti na hodnocení ze třetí zkoušky. Nyní můžeme pro předpověď použít regresní přímku nejmenších čtverců.

Předpokládejme, že chcete odhadnout nebo předpovědět průměrnou známku u závěrečné zkoušky studentů statistiky, kteří na třetí zkoušce získali 73 bodů. Výsledky zkoušek (hodnoty x) se pohybují v rozmezí od 65 do 75 bodů. Protože 73 leží mezi hodnotami x 65 a 75, dosaďte do rovnice x = 73. Potom:

\displaystyle\hat{{y}}=-{173,51}+{4,83}{({73})}={179,08}

Předpovídáme, že studenti statistiky, kteří u třetí zkoušky získali známku 73, získají u závěrečné zkoušky v průměru známku 179,08. V případě, že u závěrečné zkoušky získají známku 73, budou mít průměrnou známku 179,08.

Příklad

Využijte výše uvedené údaje pro tento příklad:

  1. Jaký byste předpověděli výsledek závěrečné zkoušky pro studenta, který ze třetí zkoušky získal 66 bodů?
  2. Jaký výsledek závěrečné zkoušky byste předpověděli studentovi, který ze třetí zkoušky získal 90 bodů?“

Řešení:

  1. 145,27
  2. Hodnoty x v datech se pohybují v rozmezí od 65 do 75. Devadesát je mimo obor pozorovaných hodnot x v datech (nezávislá proměnná), takže nelze spolehlivě předpovědět výsledek závěrečné zkoušky tohoto studenta. (I když je možné do rovnice pro x dosadit 90 a vypočítat odpovídající hodnotu y, hodnota y, kterou získáte, nebude spolehlivá.)Abyste skutečně pochopili, jak nespolehlivá může být předpověď mimo pozorované hodnoty x pozorované v datech, dosaďte do rovnice x= 90.\displaystyle\hat{{y}}=-{173,51}+{4,83}{({90})}={261,19}Skóre závěrečné zkoušky je předpovězeno na 261,19 bodů. Největší výsledek závěrečné zkoušky může být 200.

Poznámka

Proces předpovídání uvnitř pozorovaných hodnot x zjištěných v datech se nazývá interpolace. Proces předpovídání vně pozorovaných hodnot x pozorovaných v datech se nazývá extrapolace.

zkuste to

Sbírají se údaje o vztahu mezi počtem hodin týdně cvičení na hudební nástroj a výsledky v testu z matematiky. Přímka nejlepší shody je následující:

\displaystyle\hat{{y}}={72,5}+{2,8}{x}

Jaký výsledek v matematickém testu byste předpověděli u studenta, který cvičí na hudební nástroj pět hodin týdně?

Údaje Centra pro kontrolu a prevenci nemocí.

Údaje Národního centra pro prevenci HIV, pohlavních chorob a tuberkulózy.

Údaje Úřadu pro sčítání lidu Spojených států amerických. Dostupné online na adrese http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html

Data z Národního centra pro zdravotní statistiku.

Přehled pojmů

Po zjištění přítomnosti silného korelačního koeficientu a výpočtu přímky nejlepší shody můžete použít regresní přímku nejmenších čtverců k předpovědím o vašich datech.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.