3群以上での比較を行うときはどうすればよいのか。A群とB群。B群とC群。C群とA群。というように、それぞれ2群ずつでt検定を…これはもちろん×。なぜか。「見すぎによる出すぎ」の問題が起こってくるから。一つの比較につき5%は「まぐれあたり」の確率を含んでいるのに、それを3回も行ったら、15%ものまぐれあたりの確率になってしまう!
3群以上の比較をするときは、まず、A、B、C群全体での平均値がすべて等しいかどうか、という検定を行う。これがANOVA検定(Analysis of Variance)。EZRでは、「統計解析」→「連続変数」→「3群以上の間の平均値の比較(一元配置分散分析、one-way ANOVA」。で、箱ひげ図を選択しておくと、視覚的に、どの群に有意差がありそうか、判断しやすい。「2組ずつの比較(post hoc検定)は比較する群が1つの場合のみ実施される。」の下に4つほどチェックボックスがあって、Bonferroniの多重比較やHolmの多重比較などが選択できる。これらにチェックを入れておくと、ANOVAで有意差があった場合に、多重比較に進んでくれるというわけ。
さて、ANOVAは、t検定と同じく、データが正規分布に従っているという前提のうえに成り立っている。なので、ANOVAを行う前に、アウトカムの分布のばらつきを表す分散がすべての群で等しいか、Bartlett検定を行う。これでp値>0.05であれば、等分散でないとはいえない、つまり等分散性を示唆していると考える。しかし、一番確実なのは目で見て確認することなので、ヒストグラムを描く。
ヒストグラムはそれぞれの群ごとに、きれいな釣鐘型をしているか判断。少し歪んでいるな…と思ったら、ノンパラメトリック検定であるクラスカルワリス検定で、検定しなおす。
<感想>完全に自分への覚え書きですが…自分ですら、後からみて理解できるのだろうか。でも、以前勉強したときよりは、腑に落ちた感がある。