När man gör en transformation?
Mönstret av värden som erhålls när en variabel mäts hos ett stort antal individer kallas en fördelning. Fördelningen kan i stort sett klassificeras som normal och icke-normal. Normalfördelningen kallas också ”Gauss-fördelning” eftersom den först beskrevs av K.F. Gauss. Den kallas normalfördelning eftersom de flesta biologiska parametrar (t.ex. vikt, längd och blodsocker) följer den. Det finns ett fåtal biologiska parametrar som inte följer normalfördelningen, t.ex. antikroppstiter, antal episoder av diarré osv. Nybörjarna bör inte förväxlas med termen ”normal” eftersom den inte nödvändigtvis innebär klinisk normalitet och det finns inget onormalt i de ”icke-normala” fördelningarna.
Ett av antagandena för det statistiska testet som används för att testa hypoteser är att data är stickprov från normalfördelning. Därför blir det viktigt att identifiera skeva/normala fördelningar. Det finns några enkla sätt att upptäcka skevhet.
-
Om medelvärdet är mindre än dubbelt så stort som standardavvikelsen är fördelningen sannolikt skev.
-
Om populationen följer normalfördelningen är medelvärdet och standardavvikelsen för stickproven oberoende av varandra. Detta faktum kan användas för att upptäcka skevhet. Om standardavvikelsen ökar i takt med att medelvärdet ökar i olika grupper från en population är det en skev fördelning.
Förutom dessa enkla metoder kan normaliteten verifieras med hjälp av statistiska tester som Kolmogorov – Smirnov-testet.
När skevheten har identifierats bör alla försök göras för att omvandla den till en normalfördelning så att de robusta parametriska testerna kan användas för analys. Detta kan åstadkommas genom transformation.
Transformationer kan också göras för att underlätta jämförelse och tolkning. Det klassiska exemplet på en variabel som alltid rapporteras efter logaritmisk transformation är vätejonkoncentrationen (pH). Ett annat exempel där transformation hjälper till att jämföra data är den logaritmiska transformationen av dosresponskurvan. När dos-responsförhållandet plottas är det kurvilinjärt. När samma svar plottas mot log dos (log dos-responssamband) ger det en långsträckt S-formad kurva. Den mellersta delen av denna kurva är en rät linje och det är lättare att jämföra två räta linjer (genom att mäta deras lutning) än att jämföra två kurvor. Därför kan transformation hjälpa till att jämföra data.
Inför ett nötskal kan transformation utföras för att få data att följa normalfördelningen eller ibland för att underlätta tolkning/jämförelse.