의학통계

[의학통계] 성향 점수를 활용한 가중치 기법: IPTW의 이해와 적용

wony-wony 2024. 9. 19. 16:08

Propensity Scores (경향 점수)

  • 관심(처치)변수를 outcome으로 한 로지스틱 회귀 모형의 추정된 확률값
  • 처치군 내 대상자들이 갖는 확률값 vs 대조군 내 대상자들이 갖는 확률값

 

 Idea

  • 관찰(Observational study)연구에서는 모든 조건이 동일하다는 가정 하에 실험군과 대조군의 특성 변수에 대한 분포가 동일하다.
  • But,  실제로 동등한 조건의 실험군과 대조군을 설정하는 건 현실적으로 불가능하다.

 

 

  • PS (Propensity Scores)를 활용하여 관찰 연구로부터 인과적 추론 수행하고 싶다.
  • PS를 통해 실험군과 대조군 간의 RCT처럼 공변량 차이를 없앨 수 있지 않을까?

 


 

인과 관계는 다음과 같은 기준을 충족해야 한다.

  1. 시간적 순서 : 원인은 시간적으로 결과보다 앞서야 한다.
  2. 두 변수는 높은 상관 관계를 가지고 있다.
  3. 상관 관계는 우연의 일치에 의한 것이 아니어야 한다.

 

 

 

대안적으로 PS를 활용한 PSM 또는 IPTW 등의 matching 기법들을 활용하면 된다라고 하였는데,

오늘은 이 중 IPTW에 대해 알아보도록 하겠다.

 

 

 

Inverse Probability of Treatment Weights(IPTW; 성향점수 가중치)

 

  • 성향점수를 가중치로 사용해서 표본을 특정한 모집단을 나타내는 유사모집단으로 만든다.
  • IPTW는 주변구조모형(Robins, 1998)에서 치료를 받을 확률을 가중치로 사용하는 방식과 동일하다.
  • 처치군과 대조군에서 서로 다른 가중치 부여 방식을 취한다.
  • 대상자들의 데이터 손실이 발생하지 않는다는 장점을 가진다.

 

 

 

 

분석 절차는 다음과 같다.

  1. 모형 : $PS = Prob(T=1|Cov)$
  2. PS를 IPW로 변환 = $\frac{T}{PS}+\frac{1-T}{1-PS}$
  3. 가중치 표본에 대한 균형 검증
  4. 가중치 표본을 기반으로 outcome 모형 수립

 

 


PSM : matching technique     vs     IPTW : weighting technique using PS

Treatment = 1/PS

Control = 1/(1-PS)

 

Treatment 와 Control에 각각의 weight를 할당해준다.


 

 

 

매칭 후 분석을 수행할 경우 가중치를 고려한 최소자승법(weighted least squares; WLS)을 사용한 회귀 모형으로 추정한다.

이 방법은 데이터 손실이 발생되지 않는다는 장점을 가지나, 각 대상자에게 부여되는 가중치의 차이가 커지게 되면 원치 않는 분석 결과가 도출될 수도 있다!

 

또한, 각 집단에서 극단 값의 비율이 많은 경우 IPTW는 왜곡된 정보를 도출할 수 있기 때문에 세부 방법 중 극단 값을 보정하는 알고리즘을 추가적으로 적용해야한다.