Risultati dell’apprendimento

  • Utilizzare l’interpolazione e l’estrapolazione

Ricorda questo esempio dal contenuto precedente:

Un campione casuale di 11 studenti di statistica ha prodotto i seguenti dati, dove
x è il punteggio del terzo esame su 80, e y è il punteggio dell’esame finale su 200. Puoi prevedere il punteggio dell’esame finale di uno studente a caso se conosci il punteggio del terzo esame?

x (punteggio del terzo esame) y (punteggio dell’esame finale)
65 175
67 133
71 185
71 163
66 126
75 198
67 153
70 163
71 159
69 151
69 159

Tabella che mostra i punteggi dell’esame finale basato sui punteggi del terzo esame.

Questo è un grafico di dispersione dei dati forniti. Il punteggio del terzo esame è tracciato sull'asse delle x, e il punteggio dell'esame finale è tracciato sull'asse delle y. I punti formano un modello lineare forte e positivo.Schema di dispersione che mostra i punteggi dell’esame finale in base ai punteggi del terzo esame.

Abbiamo esaminato lo schema di dispersione e mostrato che il coefficiente di correlazione è significativo. Abbiamo trovato l’equazione della linea più adatta per il voto dell’esame finale in funzione del voto del terzo esame. Ora possiamo usare la linea di regressione dei minimi quadrati per la previsione.

Supponiamo di voler stimare, o prevedere, il punteggio medio dell’esame finale degli studenti di statistica che hanno ricevuto 73 al terzo esame. I punteggi degli esami (valori x) vanno da 65 a 75. Poiché 73 si trova tra i valori di x 65 e 75, sostituisci x = 73 nell’equazione. Allora:

displaystyle\hat{y}}=-{173.51}+{4.83}{({73})}={179.08}

Prevediamo che gli studenti di statistica che ottengono un voto di 73 al terzo esame otterranno in media un voto di 179.08 all’esame finale.

Esempio

Utilizza i dati di cui sopra per questo esempio:

  1. Quale sarebbe la previsione del punteggio dell’esame finale per uno studente che ha ottenuto un punteggio di 66 al terzo esame?
  2. Quale sarebbe il punteggio dell’esame finale per uno studente che ha ottenuto un punteggio di 90 al terzo esame?

Soluzione:

  1. 145.27
  2. I valori x nei dati sono compresi tra 65 e 75. Novanta è al di fuori del dominio dei valori x osservati nei dati (variabile indipendente), quindi non è possibile prevedere in modo affidabile il punteggio dell’esame finale per questo studente. (Anche se è possibile inserire 90 nell’equazione per x e calcolare un valore y corrispondente, il valore y che si ottiene non sarà affidabile). Per capire davvero quanto inaffidabile possa essere la previsione al di fuori dei valori x osservati nei dati, fate la sostituzione x= 90 nell’equazione.\displaystyle{hat{y}=-{173.51}+{4.83}{({90})}={261.19}Il punteggio dell’esame finale è previsto essere 261.19. Il più grande punteggio dell’esame finale può essere 200.

Nota

Il processo di predizione all’interno dei valori x osservati nei dati è chiamato interpolazione. Il processo di previsione al di fuori dei valori x osservati nei dati è chiamato estrapolazione.

prova

Si raccolgono dati sulla relazione tra il numero di ore a settimana di pratica di uno strumento musicale e i punteggi in un test di matematica. La linea di miglior adattamento è la seguente:

displaystyle\hat{y}}={72.5}+{2.8}{x}

Quale sarebbe la previsione del punteggio in un test di matematica per uno studente che pratica uno strumento musicale per cinque ore a settimana?

Dati del Centers for Disease Control and Prevention.

Dati del National Center for HIV, STD, and TB Prevention.

Dati dello United States Census Bureau. Disponibili online all’indirizzo http://www.census.gov/compendia/statab/cats/transportation/motor_vehicle_accidents_and_fatalities.html

Dati del National Center for Health Statistics.

Revisione del concetto

Dopo aver determinato la presenza di un forte coefficiente di correlazione e aver calcolato la linea di miglior adattamento, puoi usare la linea di regressione dei minimi quadrati per fare previsioni sui tuoi dati.

Dati del National Center for Health Statistics.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.