WANN SOLLTE TRANSFORMATION DURCHGEFÜHRT WERDEN?
Das Muster der Werte, das sich ergibt, wenn eine Variable bei einer großen Anzahl von Individuen gemessen wird, nennt man Verteilung. Verteilungen lassen sich grob in Normal- und Nicht-Normalverteilungen einteilen. Die Normalverteilung wird auch „Gauß-Verteilung“ genannt, da sie zuerst von K.F. Gauß beschrieben wurde. Sie wird als Normalverteilung bezeichnet, da die meisten biologischen Parameter (wie Gewicht, Größe und Blutzucker) ihr folgen. Es gibt nur sehr wenige biologische Parameter, die nicht der Normalverteilung folgen, z. B. Antikörpertiter, Anzahl der Durchfallepisoden usw. Die Anfänger sollten nicht mit dem Begriff „normal“ verwechselt werden, da er nicht notwendigerweise klinische Normalität impliziert und die „nicht-normalen“ Verteilungen nichts Abnormales enthalten.
Eine der Annahmen des statistischen Tests, der für die Prüfung von Hypothesen verwendet wird, ist, dass die Daten Stichproben der Normalverteilung sind. Daher ist es wichtig, schiefe/normale Verteilungen zu erkennen. Es gibt einige einfache Methoden, um Schiefe zu erkennen.
-
Wenn der Mittelwert kleiner als das Doppelte der Standardabweichung ist, dann ist die Verteilung wahrscheinlich schief.
-
Wenn die Grundgesamtheit normalverteilt ist, dann sind der Mittelwert und die Standardabweichung der Stichproben unabhängig. Diese Tatsache kann zum Nachweis von Schiefe genutzt werden. Wenn die Standardabweichung über die Gruppen einer Grundgesamtheit hinweg mit dem Mittelwert ansteigt, handelt es sich um eine schiefe Verteilung.
Abgesehen von diesen einfachen Methoden kann die Normalität durch statistische Tests wie den Kolmogorov-Smirnov-Test überprüft werden.
Wenn die Schiefe festgestellt wurde, sollte alles getan werden, um sie in eine Normalverteilung umzuwandeln, damit die robusten parametrischen Tests für die Analyse angewendet werden können. Dies kann durch Transformation erreicht werden.
Transformationen können auch zur Vereinfachung von Vergleich und Interpretation durchgeführt werden. Das klassische Beispiel für eine Variable, die immer nach logarithmischer Transformation angegeben wird, ist die Wasserstoffionenkonzentration (pH). Ein weiteres Beispiel, bei dem die Transformation für den Vergleich von Daten hilfreich ist, ist die logarithmische Transformation der Dosis-Wirkungs-Kurve. Wenn die Dosis-Wirkungs-Beziehung aufgetragen wird, ist sie krummlinig. Wenn dieselbe Reaktion gegen die logarithmische Dosis aufgetragen wird (logarithmische Dosis-Wirkungs-Kurve), ergibt sich eine langgestreckte S-förmige Kurve. Der mittlere Teil dieser Kurve ist eine gerade Linie, und der Vergleich zweier gerader Linien (durch Messung ihrer Steigung) ist einfacher als der Vergleich zweier Kurven. Daher kann eine Transformation beim Vergleich von Daten hilfreich sein.
Zusammenfassend lässt sich sagen, dass eine Transformation durchgeführt werden kann, um die Daten in eine Normalverteilung zu überführen, oder manchmal auch, um die Interpretation/Vergleiche zu erleichtern.