En hypotese er en specifik forudsigelse. Den beskriver i konkrete (snarere end teoretiske) termer, hvad du forventer, at der vil ske i din undersøgelse. Ikke alle undersøgelser har hypoteser. Nogle gange er en undersøgelse designet til at være udforskende (se induktiv forskning). Der er ingen formel hypotese, og måske er formålet med undersøgelsen at udforske et område mere grundigt med henblik på at udvikle en specifik hypotese eller forudsigelse, som kan afprøves i fremtidig forskning. En enkelt undersøgelse kan have en eller mange hypoteser.
I virkeligheden tænker jeg, når jeg taler om en hypotese, på to hypoteser på samme tid. Lad os sige, at du forudsiger, at der vil være en sammenhæng mellem to variabler i din undersøgelse. Den måde, vi formelt set ville opstille hypotesetesten på, er at formulere to hypoteseudsagn, et, der beskriver din forudsigelse, og et, der beskriver alle de andre mulige resultater med hensyn til den hypotesede sammenhæng. Din forudsigelse er, at variabel A
og variabel B
vil være relateret (du er ligeglad med, om det er en positiv eller negativ relation). Så vil det eneste andet mulige udfald være, at variabel A
og variabel B
ikke er relateret. Normalt kalder vi den hypotese, som du støtter (din forudsigelse), for den alternative hypotese, og vi kalder den hypotese, der beskriver de resterende mulige udfald, for nulhypotesen. Nogle gange bruger vi en notation som HA
eller H1
til at repræsentere den alternative hypotese eller din forudsigelse, og HO
eller H0
til at repræsentere nultilfældet. Du skal dog være forsigtig her. I nogle undersøgelser kan din forudsigelse meget vel være, at der ikke vil være nogen forskel eller ændring. I dette tilfælde forsøger du i det væsentlige at finde støtte for nulhypotesen, og du er imod alternativet.
Hvis din forudsigelse angiver en retning, og nulhypotesen derfor er forudsigelsen om ingen forskel og forudsigelsen om den modsatte retning, kalder vi dette en enhalet hypotese. Lad os f.eks. forestille os, at du undersøger virkningerne af et nyt uddannelsesprogram for medarbejdere, og at du tror, at et af resultaterne vil være, at der vil være mindre sygefravær blandt medarbejderne. Dine to hypoteser kunne formuleres nogenlunde sådan her:
Nulhypotesen for denne undersøgelse er:
HO: Som et resultat af XYZ-virksomhedens medarbejderuddannelsesprogram vil der enten ikke være nogen signifikant forskel i medarbejdernes sygefravær, eller der vil være en signifikant stigning.
som testes mod den alternative hypotese:
HA: Som følge af XYZ-virksomhedens medarbejderuddannelsesprogram vil der være et signifikant fald i medarbejdernes sygefravær.
I figuren til venstre ser vi denne situation illustreret grafisk. Den alternative hypotese – din forudsigelse om, at programmet vil mindske sygefraværet – er vist der. Nulhypotesen skal tage højde for de to andre mulige betingelser: ingen forskel eller en stigning i sygefraværet. Figuren viser en hypotetisk fordeling af fraværsforskelle. Vi kan se, at udtrykket “one-tailed” henviser til halen af fordelingen på udfaldsvariablen.
Når din forudsigelse ikke angiver en retning, siger vi, at du har en tosidet hypotese. Lad os f.eks. antage, at du undersøger en ny lægemiddelbehandling mod depression. Lægemidlet har gennemgået nogle indledende dyreforsøg, men er endnu ikke blevet afprøvet på mennesker. Du tror (baseret på teori og tidligere forskning), at lægemidlet vil have en virkning, men du er ikke sikker nok til at opstille en hypotese om en retning og sige, at lægemidlet vil reducere depression (du har trods alt set mere end nok lovende lægemiddelbehandlinger komme, som i sidste ende viste sig at have alvorlige bivirkninger, der faktisk forværrede symptomerne). I dette tilfælde kan du angive de to hypoteser på følgende måde:
Nulhypotesen for denne undersøgelse er:
HO: Som følge af 300 mg/dag af ABC-præparatet vil der ikke være nogen signifikant forskel i depression.
som testes mod den alternative hypotese:
HA: Som følge af 300 mg/dag af ABC-præparatet vil der være en signifikant forskel i depression.
Figuren til højre illustrerer denne tosidede forudsigelse for dette tilfælde. Bemærk igen, at udtrykket “two-tailed” henviser til halerne i fordelingen for din udfaldsvariabel.
Det vigtige at huske, når man opstiller hypoteser, er, at man formulerer sin forudsigelse (retningsbestemt eller ej), og derefter formulerer man en anden hypotese, som gensidigt udelukker den første og inddrager alle mulige alternative udfald for det pågældende tilfælde. Når din undersøgelsesanalyse er afsluttet, er det tanken, at du skal vælge mellem de to hypoteser. Hvis din forudsigelse var korrekt, vil du (normalt) forkaste nulhypotesen og acceptere den alternative hypotese. Hvis din oprindelige forudsigelse ikke blev understøttet af dataene, vil du acceptere nulhypotesen og forkaste den alternative hypotese. Logikken i hypotesetestning er baseret på disse to grundlæggende principper:
- formuleringen af to gensidigt udelukkende hypoteser, der tilsammen udtømmer alle mulige resultater
- afprøvningen af disse, således at den ene nødvendigvis accepteres og den anden forkastes
OK, jeg ved godt, at det er en indviklet, akavet og formalistisk måde at stille forskningsspørgsmål på. Men den omfatter en lang tradition inden for statistik kaldet den hypotetisk-deduktive model, og nogle gange er vi bare nødt til at gøre ting, fordi de er traditioner. Og hvis al denne hypotesetestning var så let, at alle kunne forstå den, hvordan tror du så, at statistikerne ville blive ansat?