KUN MUUNNOSTAA?
Jakaumaksi kutsutaan arvojen mallia, joka saadaan, kun muuttujaa mitataan suurelta määrältä yksilöitä. Jakauma voidaan karkeasti luokitella normaaliin ja epänormaaliin. Normaalijakaumaa kutsutaan myös ”Gaussin jakaumaksi”, koska K.F. Gauss kuvasi sen ensimmäisenä. Sitä kutsutaan normaalijakaumaksi, koska useimmat biologiset parametrit (kuten paino, pituus ja verensokeri) noudattavat sitä. On hyvin vähän biologisia parametreja, jotka eivät noudata normaalijakaumaa, esimerkiksi vasta-ainetitterit, ripulijaksojen lukumäärä jne. Aloittelijoita ei pidä sekoittaa termiin ”normaali”, sillä se ei välttämättä tarkoita kliinistä normaaliutta, eikä ”ei-normaaleissa” jakaumissa ole mitään epänormaalia.
Yksi hypoteesien testaamiseen käytettävän tilastollisen testin oletuksista on, että tiedot ovat otoksia normaalijakaumasta. Näin ollen on olennaista tunnistaa vinot/normaalijakaumat. On olemassa joitakin yksinkertaisia tapoja havaita vinous.
-
Jos keskiarvo on pienempi kuin kaksi kertaa keskihajonta, jakauma on todennäköisesti vinoutunut.
-
Jos perusjoukko noudattaa normaalijakaumaa, otosten keskiarvo ja keskihajonta ovat riippumattomia. Tätä tosiasiaa voidaan käyttää vinouden havaitsemiseen. Jos keskihajonta kasvaa keskiarvon kasvaessa perusjoukon eri ryhmissä, kyseessä on vino jakauma.
Tämän yksinkertaisen menetelmän lisäksi normaalisuus voidaan todentaa tilastollisilla testeillä, kuten Kolmogorovin – Smirnovin testillä.
Kun vinous on tunnistettu, on pyrittävä kaikin keinoin muokkaamaan jakauma normaalijakaumaksi, jotta analyyseihin voidaan käyttää robusteja parametrisia testejä. Tämä voidaan toteuttaa transformaatiolla.
Transformaatioita voidaan tehdä myös vertailun ja tulkinnan helpottamiseksi. Klassinen esimerkki muuttujasta, joka ilmoitetaan aina logaritmisen muunnoksen jälkeen, on vetyionikonsentraatio (pH). Toinen esimerkki, jossa muunnos auttaa tietojen vertailussa, on annos-vastekäyrän logaritminen muunnos. Kun annos-vastesuhde piirretään, se on kaareva. Kun sama vaste piirretään log-annoksen suhteen (log-annos-vastesuhteen kuvaaja), saadaan pitkänomainen S-muotoinen käyrä. Tämän käyrän keskiosa on suora, ja kahden suoran vertailu (mittaamalla niiden kaltevuus) on helpompaa kuin kahden käyrän vertailu. Näin ollen muunnos voi auttaa tietojen vertailussa.
Lyhyesti sanottuna muunnos voidaan tehdä, jotta tiedot noudattaisivat normaalijakaumaa tai toisinaan tulkinnan/vertailun helpottamiseksi.