Hvornår skal man foretage TRANSFORMATION?
Det mønster af værdier, der opnås, når en variabel måles på et stort antal individer, kaldes en fordeling. Fordelingen kan groft sagt klassificeres som normal og ikke-normal. Den normale fordeling kaldes også “Gauss-fordeling”, da den først blev beskrevet af K.F. Gauss. Den kaldes normalfordeling, da de fleste biologiske parametre (f.eks. vægt, højde og blodsukker) følger den. Der er meget få biologiske parametre, som ikke følger normalfordelingen, f.eks. antistoftiter, antal episoder med diarré osv. Begyndere bør ikke forveksles med begrebet “normal”, da det ikke nødvendigvis indebærer klinisk normalitet, og der er intet unormalt i de “ikke-normale” fordelinger.
En af antagelserne i den statistiske test, der anvendes til test af hypoteser, er, at dataene er stikprøver fra normalfordelingen. Derfor bliver det vigtigt at identificere skæve/normale fordelinger. Der er nogle enkle måder at påvise skævhed på.
-
Hvis middelværdien er mindre end det dobbelte af standardafvigelsen, er fordelingen sandsynligvis skæv.
-
Hvis populationen følger normalfordelingen, er middelværdien og standardafvigelsen af stikprøverne uafhængige af hinanden. Denne kendsgerning kan bruges til at påvise skævhed. Hvis standardafvigelsen stiger i takt med, at gennemsnittet stiger på tværs af grupper fra en population, er der tale om en skæv fordeling.
Ud over disse enkle metoder kan normalitet verificeres ved hjælp af statistiske test som Kolmogorov – Smirnov-test.
Når skævhed er identificeret, bør man gøre alt for at omdanne den til en normalfordeling, så de robuste parametriske test kan anvendes til analyse. Dette kan opnås ved transformation.
Transformationer kan også foretages for at gøre det lettere at sammenligne og fortolke dem. Det klassiske eksempel på en variabel, som altid rapporteres efter logaritmisk transformation, er hydrogenionkoncentrationen (pH). Et andet eksempel, hvor transformation hjælper til sammenligning af data, er den logaritmiske transformation af dosis-respons-kurven. Når dosis-respons-sammenhængen tegnes, er den kurvelinær. Når den samme respons plottes mod log-dosis (log-dosis-respons-plot), giver det en langstrakt S-formet kurve. Den midterste del af denne kurve er en ret linje, og det er lettere at sammenligne to rette linjer (ved at måle deres hældning) end at sammenligne to kurver. Derfor kan transformation hjælpe med at sammenligne data.
Kort sagt kan der foretages transformation for at få dataene til at følge normalfordelingen eller til tider for at lette fortolkningen/ sammenligningen.