Een hypothese is een specifieke uitspraak over een voorspelling. Ze beschrijft in concrete (eerder dan theoretische) termen wat u verwacht dat er in uw studie zal gebeuren. Niet alle studies hebben hypothesen. Soms is een studie ontworpen om verkennend te zijn (zie inductief onderzoek). Er is geen formele hypothese, en misschien is het doel van de studie om een bepaald gebied grondiger te onderzoeken om een specifieke hypothese of voorspelling te ontwikkelen die in toekomstig onderzoek kan worden getest. Een enkele studie kan één of vele hypothesen hebben.
Wanneer ik het over een hypothese heb, denk ik eigenlijk tegelijkertijd aan twee hypothesen. Stel dat u voorspelt dat er een verband bestaat tussen twee variabelen in uw studie. De manier waarop we de hypothesetest formeel zouden opzetten is het formuleren van twee hypotheseverklaringen, één die uw voorspelling beschrijft en één die alle andere mogelijke uitkomsten beschrijft met betrekking tot de gehypotheseerde relatie. Uw voorspelling is dat variabele A
en variabele B
verwant zullen zijn (het maakt u niet uit of het een positief of negatief verband is). Dan zou de enige andere mogelijke uitkomst zijn dat variabele A
en variabele B
niet verwant zijn. Gewoonlijk noemen we de hypothese die u steunt (uw voorspelling) de alternatieve hypothese, en de hypothese die de overige mogelijke uitkomsten beschrijft de nulhypothese. Soms gebruiken we een notatie als HA
of H1
om de alternatieve hypothese of uw voorspelling weer te geven, en HO
of H0
om de nulhypothese weer te geven. U moet hier echter voorzichtig mee zijn. In sommige studies kan uw voorspelling heel goed zijn dat er geen verschil of verandering zal zijn. In dat geval probeert u in wezen steun te vinden voor de nulhypothese en bent u tegen het alternatief.
Als uw voorspelling een richting aangeeft, en de nul dus de voorspelling is van geen verschil en de voorspelling van de tegenovergestelde richting, noemen we dit een eenstaarthypothese. Stel bijvoorbeeld dat u de effecten van een nieuw opleidingsprogramma voor werknemers onderzoekt en dat u denkt dat een van de resultaten zal zijn dat er minder absenteïsme van werknemers zal zijn. Uw twee hypothesen zouden ongeveer als volgt kunnen worden geformuleerd:
De nulhypothese voor dit onderzoek is:
HO: Als gevolg van het trainingsprogramma voor werknemers van bedrijf XYZ zal er ofwel geen significant verschil zijn in het ziekteverzuim van werknemers, ofwel zal er een significante stijging zijn.
die wordt getoetst aan de alternatieve hypothese:
HA: Als gevolg van het trainingsprogramma voor werknemers van bedrijf XYZ zal het ziekteverzuim onder werknemers significant afnemen.
In de figuur hiernaast zien we deze situatie grafisch weergegeven. De alternatieve hypothese – uw voorspelling dat het programma het absenteïsme zal doen dalen – is daar weergegeven. De nulhypothese moet rekening houden met de twee andere mogelijke condities: geen verschil, of een toename van het absenteïsme. De figuur toont een hypothetische verdeling van de verschillen in absenteïsme. We zien dat de term “one-tailed” verwijst naar de staart van de verdeling over de uitkomstvariabele.
Wanneer uw voorspelling geen richting aangeeft, zeggen we dat u een hypothese met twee staarten hebt. Laten we bijvoorbeeld aannemen dat u een nieuwe behandeling voor depressie bestudeert. Het medicijn heeft een aantal eerste dierproeven doorstaan, maar is nog niet getest op mensen. U gelooft (op basis van de theorie en het eerdere onderzoek) dat het medicijn een effect zal hebben, maar u bent niet zeker genoeg om een hypothese op te stellen en te zeggen dat het medicijn depressie zal verminderen (u hebt immers meer dan genoeg veelbelovende medicijnbehandelingen voorbij zien komen die uiteindelijk ernstige bijwerkingen bleken te hebben die de symptomen zelfs verergerden). In dit geval zou u de twee hypothesen als volgt kunnen formuleren:
De nulhypothese voor dit onderzoek is:
HO: Als gevolg van 300mg./dag van het ABC-geneesmiddel zal er geen significant verschil in depressie zijn.
die wordt getoetst aan de alternatieve hypothese:
HA: Als gevolg van 300mg./dag van het ABC-geneesmiddel zal er een significant verschil in depressie zijn.
De figuur hiernaast illustreert deze tweestaartige voorspelling voor dit geval. Merk opnieuw op dat de term “tweestaartig” verwijst naar de staarten van de verdeling voor uw uitkomstvariabele.
Het belangrijkste om te onthouden over het formuleren van hypothesen is dat u uw voorspelling formuleert (richtinggevend of niet), en vervolgens een tweede hypothese formuleert die de eerste wederzijds uitsluit en alle mogelijke alternatieve uitkomsten voor dat geval omvat. Wanneer uw studie-analyse is voltooid, is het de bedoeling dat u een keuze moet maken tussen de twee hypothesen. Als uw voorspelling juist was, zou u (gewoonlijk) de nulhypothese verwerpen en de alternatieve hypothese aanvaarden. Indien uw oorspronkelijke voorspelling niet werd ondersteund door de gegevens, dan aanvaardt u de nulhypothese en verwerpt u het alternatief. De logica van hypothesetoetsing is gebaseerd op deze twee basisprincipes:
- de formulering van twee elkaar uitsluitende hypothese-uitspraken die, samen, alle mogelijke uitkomsten uitputten
- de toetsing daarvan zodat de ene noodzakelijkerwijs wordt aanvaard en de andere verworpen
OK, ik weet dat het een ingewikkelde, onhandige en formalistische manier is om onderzoeksvragen te stellen. Maar het sluit aan bij een lange traditie in de statistiek, het hypothetisch-deductieve model, en soms moeten we dingen gewoon doen omdat het tradities zijn. En trouwens, als al die hypothese testen zo makkelijk waren dat iedereen het kon begrijpen, hoe denk je dat statistici dan aan het werk zouden blijven?