Propensity Scores (경향 점수)
- 관심(처치)변수를 outcome으로 한 로지스틱 회귀 모형의 추정된 확률값
- 처치군 내 대상자들이 갖는 확률값 vs 대조군 내 대상자들이 갖는 확률값
Idea
- 관찰(Observational study)연구에서는 모든 조건이 동일하다는 가정 하에 실험군과 대조군의 특성 변수에 대한 분포가 동일하다.
- But, 실제로 동등한 조건의 실험군과 대조군을 설정하는 건 현실적으로 불가능하다.
- PS (Propensity Scores)를 활용하여 관찰 연구로부터 인과적 추론을 수행하고 싶다.
- PS를 통해 실험군과 대조군 간의 RCT처럼 공변량 차이를 없앨 수 있지 않을까?
인과 관계는 다음과 같은 기준을 충족해야 한다.
- 시간적 순서 : 원인은 시간적으로 결과보다 앞서야 한다.
- 두 변수는 높은 상관 관계를 가지고 있다.
- 상관 관계는 우연의 일치에 의한 것이 아니어야 한다.
대안적으로 PS를 활용한 PSM 또는 IPTW 등의 matching 기법들을 활용하면 된다라고 하였는데,
오늘은 이 중 IPTW에 대해 알아보도록 하겠다.
Inverse Probability of Treatment Weights(IPTW; 성향점수 가중치)
- 성향점수를 가중치로 사용해서 표본을 특정한 모집단을 나타내는 유사모집단으로 만든다.
- IPTW는 주변구조모형(Robins, 1998)에서 치료를 받을 확률을 가중치로 사용하는 방식과 동일하다.
- 처치군과 대조군에서 서로 다른 가중치 부여 방식을 취한다.
- 대상자들의 데이터 손실이 발생하지 않는다는 장점을 가진다.
분석 절차는 다음과 같다.
- 모형 : $PS = Prob(T=1|Cov)$
- PS를 IPW로 변환 = $\frac{T}{PS}+\frac{1-T}{1-PS}$
- 가중치 표본에 대한 균형 검증
- 가중치 표본을 기반으로 outcome 모형 수립
PSM : matching technique vs IPTW : weighting technique using PS
Treatment = 1/PS
Control = 1/(1-PS)
Treatment 와 Control에 각각의 weight를 할당해준다.
매칭 후 분석을 수행할 경우 가중치를 고려한 최소자승법(weighted least squares; WLS)을 사용한 회귀 모형으로 추정한다.
이 방법은 데이터 손실이 발생되지 않는다는 장점을 가지나, 각 대상자에게 부여되는 가중치의 차이가 커지게 되면 원치 않는 분석 결과가 도출될 수도 있다!
또한, 각 집단에서 극단 값의 비율이 많은 경우 IPTW는 왜곡된 정보를 도출할 수 있기 때문에 세부 방법 중 극단 값을 보정하는 알고리즘을 추가적으로 적용해야한다.
'의학통계' 카테고리의 다른 글
[의학통계] PSM 분석: Propensity Scores(경향 점수)를 활용한 매칭 기법의 이해 (1) | 2024.09.19 |
---|---|
[의학통계] RCT의 강점과 관찰 연구의 대안: 인과관계 규명의 길 (0) | 2024.09.19 |