Risultati dell’apprendimento
- Utilizzare l’interpolazione e l’estrapolazione
Ricorda questo esempio dal contenuto precedente:
Un campione casuale di 11 studenti di statistica ha prodotto i seguenti dati, dove
x è il punteggio del terzo esame su 80, e y è il punteggio dell’esame finale su 200. Puoi prevedere il punteggio dell’esame finale di uno studente a caso se conosci il punteggio del terzo esame?
x (punteggio del terzo esame) | y (punteggio dell’esame finale) |
---|---|
65 | 175 |
67 | 133 |
71 | 185 |
71 | 163 |
66 | 126 |
75 | 198 |
67 | 153 |
70 | 163 |
71 | 159 |
69 | 151 |
69 | 159 |
Tabella che mostra i punteggi dell’esame finale basato sui punteggi del terzo esame.
Schema di dispersione che mostra i punteggi dell’esame finale in base ai punteggi del terzo esame.
Abbiamo esaminato lo schema di dispersione e mostrato che il coefficiente di correlazione è significativo. Abbiamo trovato l’equazione della linea più adatta per il voto dell’esame finale in funzione del voto del terzo esame. Ora possiamo usare la linea di regressione dei minimi quadrati per la previsione.
Supponiamo di voler stimare, o prevedere, il punteggio medio dell’esame finale degli studenti di statistica che hanno ricevuto 73 al terzo esame. I punteggi degli esami (valori x) vanno da 65 a 75. Poiché 73 si trova tra i valori di x 65 e 75, sostituisci x = 73 nell’equazione. Allora:
displaystyle\hat{y}}=-{173.51}+{4.83}{({73})}={179.08}
Prevediamo che gli studenti di statistica che ottengono un voto di 73 al terzo esame otterranno in media un voto di 179.08 all’esame finale.
Esempio
Utilizza i dati di cui sopra per questo esempio:
- Quale sarebbe la previsione del punteggio dell’esame finale per uno studente che ha ottenuto un punteggio di 66 al terzo esame?
- Quale sarebbe il punteggio dell’esame finale per uno studente che ha ottenuto un punteggio di 90 al terzo esame?
Soluzione:
- 145.27
- I valori x nei dati sono compresi tra 65 e 75. Novanta è al di fuori del dominio dei valori x osservati nei dati (variabile indipendente), quindi non è possibile prevedere in modo affidabile il punteggio dell’esame finale per questo studente. (Anche se è possibile inserire 90 nell’equazione per x e calcolare un valore y corrispondente, il valore y che si ottiene non sarà affidabile). Per capire davvero quanto inaffidabile possa essere la previsione al di fuori dei valori x osservati nei dati, fate la sostituzione x= 90 nell’equazione.\displaystyle{hat{y}=-{173.51}+{4.83}{({90})}={261.19}Il punteggio dell’esame finale è previsto essere 261.19. Il più grande punteggio dell’esame finale può essere 200.
Nota
Il processo di predizione all’interno dei valori x osservati nei dati è chiamato interpolazione. Il processo di previsione al di fuori dei valori x osservati nei dati è chiamato estrapolazione.
prova
Si raccolgono dati sulla relazione tra il numero di ore a settimana di pratica di uno strumento musicale e i punteggi in un test di matematica. La linea di miglior adattamento è la seguente:
displaystyle\hat{y}}={72.5}+{2.8}{x}
Quale sarebbe la previsione del punteggio in un test di matematica per uno studente che pratica uno strumento musicale per cinque ore a settimana?
Dati del Centers for Disease Control and Prevention.
Dati del National Center for HIV, STD, and TB Prevention.
Dati dello United States Census Bureau. Disponibili online all’indirizzo http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html
Dati del National Center for Health Statistics.
Revisione del concetto
Dopo aver determinato la presenza di un forte coefficiente di correlazione e aver calcolato la linea di miglior adattamento, puoi usare la linea di regressione dei minimi quadrati per fare previsioni sui tuoi dati.