WHEN TO DO TRANSFORMATION?

Rozkład wartości uzyskanych, gdy zmienna jest mierzona w dużej liczbie osobników nazywamy rozkładem. Rozkład może być szeroko sklasyfikowany jako normalny i nienormalny. Rozkład normalny jest również nazywany „rozkładem gaussowskim”, ponieważ został on po raz pierwszy opisany przez K.F. Gaussa. Rozkład ten nazywamy rozkładem normalnym, ponieważ większość parametrów biologicznych (takich jak waga, wzrost i poziom cukru we krwi) podąża za nim. Istnieje bardzo niewiele parametrów biologicznych, które nie są zgodne z rozkładem normalnym, np. miano przeciwciał, liczba epizodów biegunki itp. Początkujący nie powinni być myleni z terminem „normalny”, ponieważ nie musi on oznaczać normalności klinicznej i nie ma nic nienormalnego w rozkładach „nienormalnych”.

Jednym z założeń testu statystycznego używanego do testowania hipotez jest to, że dane są próbkami z rozkładu normalnego. W związku z tym istotna staje się identyfikacja rozkładów skośnych/normalnych. Istnieje kilka prostych sposobów na wykrycie skośności.

  • Jeśli średnia jest mniejsza niż dwukrotność odchylenia standardowego, to rozkład jest prawdopodobnie skośny.

  • Jeśli populacja podąża za rozkładem normalnym, to średnia i odchylenie standardowe próbek są niezależne. Fakt ten może być wykorzystany do wykrywania skośności. Jeśli odchylenie standardowe wzrasta wraz ze wzrostem średniej w grupach z danej populacji, to jest to rozkład skośny.

Oprócz tych prostych metod, normalność można zweryfikować za pomocą testów statystycznych, takich jak test Kołmogorowa – Smirnowa.

Po zidentyfikowaniu skośności, należy podjąć wszelkie próby przekształcenia go w rozkład normalny, tak aby do analizy można było zastosować solidne testy parametryczne. Może to być osiągnięte przez transformację.

Transformacje mogą być również wykonane dla ułatwienia porównania i interpretacji. Klasycznym przykładem zmiennej, która jest zawsze podawana po transformacji logarytmicznej jest stężenie jonów wodorowych (pH). Innym przykładem, w którym transformacja pomaga w porównaniu danych, jest transformacja logarytmiczna krzywej dawka-odpowiedź. Kiedy zależność dawka-odpowiedź jest wykreślona, jest ona krzywoliniowa. Kiedy ta sama odpowiedź jest wykreślona w stosunku do log dawki (log dose-response plot) daje wydłużoną krzywą w kształcie litery S. Środkowa część tej krzywej jest linią prostą, a porównanie dwóch linii prostych (poprzez pomiar ich nachylenia) jest łatwiejsze niż porównanie dwóch krzywych. Stąd transformacja może pomóc w porównaniu danych.

W skrócie, transformacja może być przeprowadzona, aby dane były zgodne z rozkładem normalnym lub czasami dla łatwości interpretacji/porównania.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.