①ロジスティック回帰分析とは
アウトカム変数が2値変数(疾患のある、なしや生存、死亡など)である場合に用いる分析。結果をオッズ比で算出する。オッズは、「ある事象が起こる確率÷ある事象が起こらない確率」。オッズ比は、2つの群でオッズの比をとった値。
②logisticコマンド、logitコマンド
logistic アウトカム変数(2値変数) 要因変数群(連続変数でも2値変数でもOK)
例えば急性心筋梗塞(ami)の発生なし(0)発生あり(1)と喫煙(smoke)、年齢(age)の関係を調べたいなら、
logistic ami smoke age
回帰係数を表示したいときはlogitコマンドを使う。
logit ami smoke age
このあとに,orを付けるとロジスティック回帰分析の結果も表示される。
logit ami smoke age,or
また、さきほどのlogisticコマンドで,coefを付けると回帰係数(β係数)が表示される。
logistic ami smoke age,coef
③解釈の注意
上記のようにコマンドを走らせて、例えばageのオッズ比が1.52であった場合、「年齢が1増えると、AMI発症のオッズ比が1.52倍有意に高くなる」ということ。では、年齢が5歳増えたときは?単純にこのオッズ比を5倍する?NO!
オッズ=e(β×要因の有無+定数+残差)
と、決まっている。eって何。e=2.718…
eは自然対数の底(てい)です。指数関数exponentialの頭文字。もしくはオイラーが名付けたので、自分の名前Eulerの頭文字かもしれない。
例えば喫煙なし(0)あり(1)とすると喫煙あり群のAMI発症オッズ=e(β×1+定数)=e(β+定数)となる。()の中の×1というのは、「あり」を「1」としているから。
喫煙なし群のAMI発症オッズ=e(β×0+定数)=e(定数)となる。()の中の×0というのは、「なし」を「0」としているから。
よって喫煙あり群の喫煙なし群に対するAMIの発症オッズ比=e(β+定数)/e(定数)=eβ
例えばβ係数が0.60だったとするとオッズ比はe0.60=1.82と算出できる。
この、オッズ比=eβということを思い出せば、年齢が5歳増えたときのオッズ比は、1歳増えたときのオッズ比の5倍ではない。
「5歳増えたときのオッズ比」=exp(β係数×5)=exp(β係数)の5乗=「1増えたときのオッズ比の5乗」となる。display exp(β係数の数値を記入*5)とすれば求められる。