의학통계

[의학통계] PSM 분석: Propensity Scores(경향 점수)를 활용한 매칭 기법의 이해

wony-wony 2024. 9. 19. 15:43

Propensity Scores (경향 점수)

  • 관심(처치)변수를 outcome으로 한 로지스틱 회귀 모형의 추정된 확률값
  • 처치군 내 대상자들이 갖는 확률값 vs 대조군 내 대상자들이 갖는 확률값

 

 Idea

  • 관찰(Observational study)연구에서는 모든 조건이 동일하다는 가정 하에 실험군과 대조군의 특성 변수에 대한 분포가 동일하다.
  • But,  실제로 동등한 조건의 실험군과 대조군을 설정하는 건 현실적으로 불가능하다.

 

 

  • PS (Propensity Scores)를 활용하여 관찰 연구로부터 인과적 추론 수행하고 싶다.
  • PS를 통해 실험군과 대조군 간의 RCT처럼 공변량 차이를 없앨 수 있지 않을까?

 


 

인과 관계는 다음과 같은 기준을 충족해야 한다.

  1. 시간적 순서 : 원인은 시간적으로 결과보다 앞서야 한다.
  2. 두 변수는 높은 상관 관계를 가지고 있다.
  3. 상관 관계는 우연의 일치에 의한 것이 아니어야 한다.

 

 

 

대안적으로 PS를 활용한 PSM 또는 IPTW 등의 matching 기법들을 활용하면 된다라고 하였는데,

오늘은 이 중 PSM에 대해 알아보도록 하겠다.

 

 

PSM 분석 절차

 

  1. PSM 수행에 적절한 자료인지 식별한다.(large sample size)
  2. 처치군(treatment)과 대조군(control) 및 outcome을 정의한다.
  3. 관심 공변량을 선택한다.(공변량 = 관심(처치)변수 + 매칭변수 + 그외 공변량)

       - 연속 공변량은 매칭하기 어렵기 때문에 관심 변수는 가급적 범주화(이범주) 시킨다.

       - 매칭변수가 너무 많으면 군 간 일치시키기 어렵고 변동성이 커질 수 있다.

       - 처치군에 의해 영향을 받는 변수는 매칭변수에 포함시키지 않고 추후 모형 수립에 포함한다.

 

   4. 경향점수를 추정한다.(관심(처치)변수 ~ 매칭변수)

   5. 경향점수를 통해서 그룹 내 ID를 매칭한다.

   6. 균형 진단 방법을 통하여 매칭 결과를 평가한다.

   7. 경향점수로 보정된 표본을 통해 outcome에 대한 분석을 수행한다.

 

 

 

 

여기서, Matching variables (매칭변수) 란?

  • outcome과 관심변수에 영향을 미치는 모든 변수들은 matching variables에 포함해야 하지만 결과변수와의 관계가 강한 변수들을 넣은 것이 우선이다.
  • Treatment assignment에 의해 영향을 받는 변수와 해당 변수를 완전히 예측할 수 있는 변수들은 제외하는 것이 좋다.
  • 선정하는 특별한 통계적인 measure는 없다.

 

 

 

 

 

이제 경향점수(propensity score)를 추정하는 과정에 대해 설명하겠다.

 

Baseline에서 측정된 공변량을 기준으로 관심(처치)변수에 관한 모형을 적합시키면 된다.

  • 이범주 관심변수에 가장 많이 사용하는 모형은 로지스틱 회귀(logistic regression)이다.
  • 최근에는 기계학습 기반의 모형도 활용된다.

로지스틱 회귀 모델에서 경향성 점수는 공변량 집합을 기준으로 치료를 받을 예측확률이다.

$$ e_{i} = P(T_{i}=1|X_i)$$

 

 


PSM에서 모형 수립의 목표는 관심변수 그룹 내 공변량을 균형 있게 맞추는 것이다.

 

예측력, 간결한 모형, 모형의 과적합, goodness of fit 등에는 관심이 없다!


 

 

 

이제, 로지스틱 모형을 통해 추정된 예측 확률을 사용하여 균형 잡힌 매칭 표본을 생성한다.

 

매칭 시 사용되는 대표적인 방법으로는 

  • Nearest neighbor 1:1 (1:N) matching (최근접 이웃 1:1 매칭)

       - 치료 대상자 한 명과 가장 가까운 성향점수를 가진 대조군을 한 명 매칭한다.

       - 대조군이 많은 경우, 치료 대상자 한 명당 두 명 이상의 대조군을 취할 수 있다. 

 

  • Nearest neighbor 1:1 (or 1:N) matching with Caliper

       - 캘리퍼(caliper)를 통해 성향점수 범위 내(<0.25 or 0.2 of S)에서 매칭한다.

 

  • Greedy algorithm / Kernel, Local Linear, Mahalanobis 등의 방식을 활용할 수 있다.

 

 

 

 

 

매칭된 표본을 생성한 다음 검증을 하는 과정도 필요하다. 

 

PSM의 목표는 매칭된 그룹에서 유사한 분포를 갖는 것이기 때문에 매칭변수들에 대한 균형(balance) 진단을 해준다.

  • 표준화된 차이(standardized (mean) differences; SMD)를 사용하여 두 그룹 간의 평균과 비율의 차이를 정량화 한다.
  • 히스토그램과 누적밀도그림을 사용하여 모형에 사용된 연속형 공변량의 분포를 비교한다.
  • 표본의 수에 의존적인 P-value값을 사용하지 않고 균형을 진단하기 위한 다양한 측정값을 활용한다.

 

 

 

 

 

검증을 한 후에는 경향점수로 보정된 표본을 통해 결과 분석을 수행한다.

 

간단하게 말하자면, 매칭된 샘플에 대한 회귀 모형을 수립하면 된다.

outcome모형에서 매칭된 공변량의 계수에 관심이 없다면 포함시키지 않아도 된다.

하지만, 해당 계수에 명확한 관심이 있다면 성향점수 모형에 포함시키지 않아야 한다!