Learning Outcomes
- Az interpoláció és az extrapoláció használata
Emlékezzünk vissza erre a példára a korábbi tartalomból:
Egy 11 statisztika szakos hallgatóból álló véletlen minta a következő adatokat adta, ahol
x a 80-ból a harmadik vizsgapont, y pedig a 200-ból a végső vizsgapont. Meg tudja-e jósolni egy véletlenszerűen kiválasztott hallgató végső vizsgaeredményét, ha ismeri a harmadik vizsgaeredményt?
x (harmadik vizsga pontszáma) | y (záróvizsga pontszáma) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
A záróvizsga pontszámát bemutató táblázat a harmadik vizsgán elért pontszámok alapján.
A záróvizsga pontszámait a harmadik vizsga pontszámai alapján mutató szórásdiagram.
Vizsgáltuk a szórásdiagramot, és kimutattuk, hogy a korrelációs együttható szignifikáns. Megtaláltuk a legjobb illeszkedésű egyenes egyenletét a záróvizsga jegyének a harmadik vizsgán kapott jegy függvényében. Most már használhatjuk a legkisebb négyzetek regressziós egyenesét az előrejelzéshez.
Tegyük fel, hogy meg akarjuk becsülni, vagyis meg akarjuk jósolni a harmadik vizsgán 73 pontot kapott statisztika szakos hallgatók záróvizsga-pontszámának átlagát. A vizsgaeredmények (x-értékek) 65 és 75 között mozognak. Mivel 73 a 65 és 75 x-értékek között van, helyettesítsük az egyenletbe az x = 73 értéket. Ekkor:
\displaystyle\hat{{y}}=-{173.51}+{4.83}{({73})}={179.08}
Megjósoljuk, hogy azok a statisztikus hallgatók, akik a harmadik vizsgán 73 pontot kaptak, a záróvizsgán átlagosan 179.08 pontot fognak kapni.
Példa
A fenti adatokat használjuk a következő példára:
- Mit jósolna annak a diáknak, aki a harmadik vizsgán 66 pontot szerzett, a záróvizsga pontszámára?
- Milyennek jósolná a záróvizsga pontszámát annak a diáknak, aki 90 pontot ért el a harmadik vizsgán?
Megoldás:
- 145,27
- Az adatokban szereplő x értékek 65 és 75 között vannak. A kilencven kívül esik az adatokban megfigyelt x értékek tartományán (független változó), így nem lehet megbízhatóan megjósolni ennek a diáknak a záróvizsga-eredményét. (Annak ellenére, hogy az x egyenletbe be lehet írni 90-et, és ki lehet számítani a megfelelő y értéket, a kapott y érték nem lesz megbízható.) Hogy valóban megértsük, mennyire megbízhatatlan lehet az előrejelzés az adatokban megfigyelt x értékeken kívül, tegyük be az egyenletbe az x=90 helyettesítést. \displaystyle\hat{{y}}=-{173.51}+{4.83}{({90})}={261.19}A záróvizsga pontszámot 261.19-re jósoljuk. A legnagyobb végső-vizsga pontszám, ami lehet, 200.
Jegyzet
Az adatokban megfigyelt x értékeken belül megfigyelt x értékek előrejelzésének folyamatát interpolációnak nevezzük. Az adatokban megfigyelt, megfigyelt x értékeken kívüli előrejelzés folyamatát extrapolációnak nevezzük.
próbáld ki
Adatokat gyűjtöttünk egy hangszer heti gyakorlásával töltött órák száma és egy matematikai teszten elért pontszámok közötti kapcsolatról. A legjobb illeszkedés egyenese a következő:
\displaystyle\hat{{y}}={72.5}+{2.8}{x}
Milyen eredményt jósolna egy matematikai teszten annak a diáknak, aki heti öt órát gyakorol egy hangszeren?
A Centers for Disease Control and Prevention adatai.
A National Center for HIV, STD, and TB Prevention adatai.
A United States Census Bureau adatai. Elérhető online a http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Adatok a National Center for Health Statistics-tól.
Koncepció áttekintése
Az erős korrelációs együttható jelenlétének megállapítása és a legjobb illeszkedés egyenesének kiszámítása után a legkisebb négyzetek regressziós egyenesét használhatja az adatokra vonatkozó előrejelzésekhez.