難しい…とりあえず、自分レベルの人に、今日の自分が説明できる範囲で説明するように、書いてみる。
①前提として必要な知識…発生割合と発生率の違い
ある観察期間中に、対象集団の中で何人アウトカムが発生したか、その発生したかしないかだけを知りたい場合は、発生割合を記述すればよい。
発生割合=アウトカムを起こした人数÷対象者の人数
発生割合は、リスク、と同義。人数を人数で割るので、発生割合には単位は無い。例)ある癌の5年後の死亡割合。
一方、ある観察期間中のどのタイミングでアウトカムが発生したか、アウトカムの発生するスピード、にも関心がある場合は、発生率を求める。
発生率=アウトカムを起こした人数÷対象者が観察された時間の総和
発生率の単位は〇〇人年、などとなる。例)ある癌の死亡率が0.21/人年…100人を1年追跡すると21人死亡すると解釈できる。
②生存時間解析の特徴
例えば、ある治療を行ったのち、〇人が再発した。でも、3か月後に再発するのと、3年後に再発するのでは、臨床的には全くその治療の意義のとらえ方が異なってくる。つまり、観察期間中のいつ発生したのか、発生するスピード、に関心がある。そのような場合に用いるのが、生存時間解析。
③生存時間解析の3ステップ
1)カプランマイヤー曲線:たんなる記述。時間とともに人数が減っていく様子を図示。
2)ログランク検定:生存曲線どうしを比較したいときに用いる。特に、アウトカムが発生する時期によって重みづけを変えたりしていないので、ハザード比が一定である場合に、敏感に差を検出できる。
(これに対し、ウィルコクソン検定は、時期による重みづけをしているので、早期の群間差を敏感に検出できる。)
ここで…ハザードって、なんだっけ?ハザードは、「その瞬間の発生率(研究のアウトカムによっては、死亡率)」です!ハザード自体は、時間とともに変化する。だが、ハザードの比は常に一定、ということを仮定して、ログランク検定やCox回帰分析は行う(この仮定を、比例ハザード性の仮定という)。
3)Cox比例ハザードモデル:ログランク検定の多変量解析版というイメージ。色々なサイトをみたけど…自分の数学能力では、Coxさんが1972年に提唱した、ハザード自体を求めなくてもハザード比を求められる方法、を用いた検定、としか言えない!そして、そんな自分でもうすうす感じていたが、前提となっている「ハザード比は常に一定」というのは、かなりの確率で成り立っていない、にも関わらず論文ではCox比例ハザードモデルが多用されている、ということが、あるサイトで触れられていた。M3の統計記事では、「まずは、比例ハザード性が担保されているかどうか、log-log plotやSchoenfeld残差を用いて、目で見て確認する。比例ハザード性が満たされない場合は、early effect、delayed effect、diminishing effectのどれに該当するのか生存曲線から判断し、最適な手法を選ぶ必要がある」とのこと。Cox比例ハザードモデル以外の色々な手法とは、
加速寿命モデル(accelerated failure time model)
マイルストーン解析(milestone analysis)
境界内平均生存期間(restricted mean survival time:RMST)
もはや、未来の自分のための単なるまとめ記事となった。今後、もっと理解できるようになりますように。。