¿Cuándo hacer la transformación?
El patrón de valores que se obtiene cuando se mide una variable en un gran número de individuos se llama distribución. La distribución puede clasificarse a grandes rasgos en normal y no normal. La distribución normal también se llama «distribución gaussiana», ya que fue descrita por primera vez por K.F. Gauss. Se denomina distribución normal porque la mayoría de los parámetros biológicos (como el peso, la altura y la glucemia) la siguen. Hay muy pocos parámetros biológicos que no siguen la distribución normal, por ejemplo el título de anticuerpos, el número de episodios de diarrea, etc. No hay que confundir a los principiantes con el término «normal», ya que no implica necesariamente normalidad clínica y no hay nada anormal en las distribuciones «no normales».
Uno de los supuestos de la prueba estadística utilizada para la comprobación de hipótesis es que los datos son muestras de una distribución normal. De ahí que sea esencial identificar las distribuciones sesgadas/normales. Hay algunas formas sencillas de detectar la asimetría.
-
Si la media es menor que el doble de la desviación estándar, entonces es probable que la distribución sea asimétrica.
-
Si la población sigue una distribución normal, entonces la media y la desviación estándar de las muestras son independientes. Este hecho puede utilizarse para detectar la asimetría. Si la desviación estándar aumenta a medida que la media aumenta en los grupos de una población, entonces se trata de una distribución sesgada.
Aparte de estos métodos sencillos, la normalidad puede verificarse mediante pruebas estadísticas como la prueba de Kolmogorov – Smirnov.
Una vez identificada la asimetría, debe hacerse todo lo posible para convertirla en una distribución normal, de modo que puedan aplicarse las pruebas paramétricas robustas para el análisis. Esto puede lograrse mediante una transformación.
También pueden hacerse transformaciones para facilitar la comparación y la interpretación. El ejemplo clásico de una variable que siempre se reporta después de la transformación logarítmica es la concentración de iones de hidrógeno (pH). Otro ejemplo en el que la transformación ayuda a comparar los datos es la transformación logarítmica de la curva dosis-respuesta. Cuando se traza la relación dosis-respuesta, ésta es curvilínea. Cuando la misma respuesta se traza frente a la dosis logarítmica (gráfico de dosis-respuesta logarítmica) se obtiene una curva en forma de S alargada. La parte central de esta curva es una línea recta y comparar dos líneas rectas (midiendo su pendiente) es más fácil que comparar dos curvas. Por lo tanto, la transformación puede ayudar a comparar los datos.
En pocas palabras, la transformación puede llevarse a cabo para que los datos sigan una distribución normal o, en ocasiones, para facilitar la interpretación/comparación.