Stataのコマンドその6(ロジスティック回帰分析)

①ロジスティック回帰分析とは

アウトカム変数が2値変数(疾患のある、なしや生存、死亡など)である場合に用いる分析。結果をオッズ比で算出する。オッズは、「ある事象が起こる確率÷ある事象が起こらない確率」。オッズ比は、2つの群でオッズの比をとった値。

②logisticコマンド、logitコマンド

logistic アウトカム変数(2値変数) 要因変数群(連続変数でも2値変数でもOK)

例えば急性心筋梗塞(ami)の発生なし(0)発生あり(1)と喫煙(smoke)、年齢(age)の関係を調べたいなら、

logistic ami smoke age

回帰係数を表示したいときはlogitコマンドを使う。

logit ami smoke age

このあとに,orを付けるとロジスティック回帰分析の結果も表示される。

logit ami smoke age,or

また、さきほどのlogisticコマンドで,coefを付けると回帰係数(β係数)が表示される。

logistic ami smoke age,coef

③解釈の注意

上記のようにコマンドを走らせて、例えばageのオッズ比が1.52であった場合、「年齢が1増えると、AMI発症のオッズ比が1.52倍有意に高くなる」ということ。では、年齢が5歳増えたときは?単純にこのオッズ比を5倍する?NO!

オッズ=e(β×要因の有無+定数+残差)

と、決まっている。eって何。e=2.718…

eは自然対数の底(てい)です。指数関数exponentialの頭文字。もしくはオイラーが名付けたので、自分の名前Eulerの頭文字かもしれない。

例えば喫煙なし(0)あり(1)とすると喫煙あり群のAMI発症オッズ=e(β×1+定数)=e(β+定数)となる。()の中の×1というのは、「あり」を「1」としているから。

喫煙なし群のAMI発症オッズ=e(β×0+定数)=e(定数)となる。()の中の×0というのは、「なし」を「0」としているから。

よって喫煙あり群の喫煙なし群に対するAMIの発症オッズ比=e(β+定数)/e(定数)=eβ

例えばβ係数が0.60だったとするとオッズ比はe0.60=1.82と算出できる。

この、オッズ比=eβということを思い出せば、年齢が5歳増えたときのオッズ比は、1歳増えたときのオッズ比の5倍ではない。

「5歳増えたときのオッズ比」=exp(β係数×5)=exp(β係数)の5乗=「1増えたときのオッズ比の5乗」となる。display exp(β係数の数値を記入*5)とすれば求められる。

タイトルとURLをコピーしました