わかる範囲で、未来の自分への覚え書き。
①傾向スコア分析とは?
1985年にRosenbaumとRubinが提案。患者の背景因子の違いによって治療法AとBの効果を正しく評価できない(交絡が生じている)→交絡の影響を除去して疑似ランダム化を行うことで、RCTに準じた結果を得ることができるのが、傾向スコア(propensity score:PS)分析。
②傾向スコアって?
患者の持っている背景因子から、医師がある治療法を選択する確率が傾向スコア。
傾向スコアの算出にはロジスティック回帰分析を用いることが多い。ロジスティック回帰分析の目的変数に治療法(例えば治療Aをy=1, 治療Bをy=0)をおき、説明変数に背景因子を入れる。
この説明変数の選択基準の注意点→治療法選択にかかわる因子ということなので、治療開始前または同時点で得られるような情報しか説明変数として用いてはいけない。例えば、年齢や性別、重症度などはOKだが、実際どれくらいの期間治療したかということや、その後の経過に関する情報などは、用いてはいけない。
ほかに、通常のロジスティック回帰分析と異なる点→治療法の選択と治療効果に関与すると思われる変数ならば、いくらでも入れてよい。
こうしてロジスティック回帰を実施したのちに、患者毎に治療Aを選択する確率を計算する。これが傾向スコアになる。
計算する、とさらっと書いたが、実際の計算の仕方を以下に述べる。患者が実際に受けた治療をYとする。治療Aを受けた場合はY=1、治療Bを受けた場合はY=0とする。Yを目的変数、患者の背景因子など(X1, X2, …Xn)を独立変数とするロジスティック回帰分析を行う。個々の患者が治療Aを受ける確率をpとすると、以下の式が成り立つ。
③傾向スコアを用いた疑似的なランダム化の仕方…いろいろある。
1)傾向スコアマッチング
傾向スコアが近い患者を治療A群とB群それぞれからペアで抽出する。ただ、かけ離れた傾向スコアの患者どうしをマッチさせることを回避するため、caliperといって「どの程度傾向スコアが違っていてもペアとして容認するか」という数値をあらかじめ設定しておく。
次に、傾向スコアマッチングで得られた患者のデータだけを用いて、治療A群とB群で治療効果を比較する。
この方法の欠点としては、ペアとして選ばれなかった患者は、なかったことになる(治療効果の比較に用いられない)ということ。そのため、必ず元の患者数よりも少ない患者数で治療効果を比較することになってしまう。
2)逆確率による重みづけ(IPTW)
上記1)の方法でこぼれてしまうような患者も含め、すべてのデータを利用できるように考え出された方法で、重みづけを取り入れている。例えば治療A群のひとりの患者の、治療Aを受ける確率(傾向スコア:PS)が0.2だったとすると、重み=1÷PSで、5と算出される。この意味は、この患者を5例分のデータとして治療効果の比較に使うということ。治療B群のひとりの患者の、治療Aを受ける確率(PS)が0.2だったとすると、重み=1÷(1-PS)で、1.25と算出される。すなわち、この患者は1.25人分のデータとして扱う。