WHEN TO DO TRANSFORMATION?
ある変数を多数の個体で測定したときに得られる値のパターンを分布と呼びます。 分布は正規分布と非正規分布に大別されます。 正規分布は、K.F.ガウスによって初めて記述されたことから「ガウス分布」とも呼ばれます。 生体パラメータ(体重、身長、血糖値など)のほとんどがこれに従うため、正規分布と呼ばれています。 しかし、抗体価や下痢の回数など、正規分布に従わない生物学的パラメータもごくわずかながら存在します。
仮説の検証に使用する統計検定の前提の1つは、データが正規分布からのサンプルであることです。 したがって、歪んだ分布や正規分布を識別することが不可欠になります。
-
平均が標準偏差の2倍より小さい場合、分布は歪んでいる可能性があります。
-
集団が正規分布に従っていれば、サンプルの平均と標準偏差は独立しています。 この事実は、歪度を検出するのに利用できます。 これらの単純な方法とは別に、正規性はKolmogorov – Smirnov検定などの統計検定で検証することができます。
一度歪度が識別されると、ロバストパラメトリック検定を分析のために適用できるように、正規分布に変換するためにあらゆる試みを行う必要があります。 これは変換によって達成できる。
変換はまた、比較と解釈を容易にするために行うことができる。 対数変換後に常に報告される変数の古典的な例は、水素イオン濃度(pH)です。 データの比較に変換が役立つもう一つの例は、用量反応曲線の対数変換です。 用量反応関係をプロットすると、曲線になります。 同じ反応を対数用量に対してプロットすると(log dose-response plot)、細長いS字型の曲線になります。 この曲線の中央部分は直線であり、2つの直線を比較する(傾きを測定する)ことは、2つの曲線を比較するよりも簡単です。 したがって、変換はデータの比較に役立ちます。
一言で言えば、変換はデータが正規分布に従うようにするため、あるいは解釈や比較を容易にするために行われることがあります。