Potential Outcome

어려운 인과추론을 공부하다가 두통이 생겼다고 가정해보자. 이때 타이레놀을 먹고 두통이 나았다면, 타이레놀의 섭취가 두통 완화의 원인이라고 할 수 있을까?

(1) 만약 약을 먹지 않고도 두통이 나았을 가능성이 있다면, 타이레놀이 필수적인 요소는 아닌 것이고, 타이레놀의 인과 효과(causal effect)는 약하다고 볼 수 있을 것이다.

(2) 그러나 만약 타이레놀을 먹지 않으면 두통이 낫지 않는다고 해보자. 이 경우 타이레놀의 효과에 대해 강하게 확신할 수 있을 것이다.

위 예시에서 우리는 잠재적인 결과를 생각했다. 즉 어떤 행위를 했을 때 결과가 어떻게 될지를 나타내고 이런 행위의 효과를 추정하는 것이 인과추론의 목적이라고도 할 수 있다.

이제 이를 좀 더 수학적으로 표현해보자.

※ Notation 정리
: 처치(Treatment) 변수 (위 예시에서는 타이레놀 섭취 여부, 먹었으면 1, 아니면 0 / binary뿐 아니라 연속형도 가능하다)

: 관심 있는 결과(Outcome) (위 예시에서는 두통이 나았으면 1, 아니면 0)

: 공변량 변수(Covariates) (잠시 후 추가 설명)

: 특정 unit, individual을 나타내기 위한 표기

: i번째 유닛의 결과 : i번째 유닛이 Treatment가 1일 때의 Potential Outcome (i번째 유닛이 타이레놀을 먹었을 때의 Potential Outcome), 간단하게 과 같이 표현하기도 한다.

위 Notation으로 위 예시를 다시 정리한다면 (1)번 상황은 , (2)번 상황은 로 표현할 수 있다.

ITE (Individual Treatment Effect)

이처럼 번째 유닛에 대한 ITE(개별 처치 효과) 는 다음과 같은 식으로 정의할 수 있다. 즉 i번째 유닛이 처치를 받았을 때의 결과와 처치를 받지 않았을 때의 potential outcome의 차이이다.

그런데 조금 이상한 점이 있다. 이 ITE는, 두 결과를 모두 관측 가능한 경우에나 알 수 있는 것이다.

7월 31일에 내가 머리가 아파서 타이레놀을 먹었다면, 내가 타이레놀을 먹지 않았을 때도 머리가 괜찮아졌을지 아니면 여전히 아팠을지는 알 수 없는 문제이다. (타임머신을 타고 돌아가서 다시 선택을 하지 않는 한)

은 관측했지만 은 동시에 관측할 수 없다.

ATE (Average Treatment Effect)

Fundamental Problem of Causal Inference

이는 인과추론의 근본적인 문제이기도 한데, 관측할 수 없다는 것은 아래 표처럼 데이터가 송송 뚫려있다는 것. 이래서는 타이레놀의 개별 처치 효과(ITE)를 정확하게 추정할 수가 없다.

그래도 평균적인 타이레놀의 효과()는 구할 수 있지 않을까? 그게 관심 있는 값이기도 할 테고. 이를 ATE(Aveage Treatment Effect)1 라고 하는데, 기댓값의 선형성을 이용해서 로 변환할 수 있다.

내가 저 변환을 보고 가장 먼저 생각했던 것은, ‘그냥 관측된 값들에만 평균(Expectation)을 취해서 빼버리면 안 될까?’ 하는 것이었다. 그러면 아래 예시처럼 으로 간단하게 구할 수 있어 보인다.

그러나 내가 라고 생각하고 평균을 구했던 것은 사실 이었다. 즉 내가 구한 것은 인데, 이는 Associational Difference라고 하고 내가 구하고자 하는 ATE와는 다르다. 실제로, 두 값은 (웬만하면) 다르게 나온다!

어떻게 이런 차이가 발생할 수 있을까?

Associational Difference vs Average Treatment Effect

두통약을 개발해서 처방해주는 괴짜 의사가 있다. (편의점에서도 쉽게 구할 수 있지만 예시를 위해 이 의사에게만 두통약을 구할 수 있다고 하자)

이 의사는 약 효과의 홍보를 위해, 얼핏 진단했을 때 얼른 나을 것 같은 환자에게만 두통약을 처방해주었다. 그렇게 되면 약이 효과가 있든 없든 약을 먹은 환자군에서() 두통이 낫는 비율()도 당연히 높을 수밖에 없지 않을까?

즉, 약이 사실은 효과가 없더라도 저 진단의 결과로 인해 약이 효과가 있는 것처럼 보이는 것이다.

이것은 즉 진단 결과(또는 환자의 상태)인 공변량 에 모두 영향을 줬기 때문이다. , 간 상관관계가 발생했고, 에 인과관계는 없지만 상관관계가 발생한 것이다. (confounding이라고도 한다. 나중에 설명)

이는 현실에서 아주 많이 발생할 수 있는 문제이다. 그렇기 때문에 그룹에서의 값 평균과 그룹에서의 값 평균을 단순히 비교하는 것은 위험할 수 있다. 다만 특정 조건 하에서 이 associational difference와 ATE가 같아질 수 있는데, 다음 장에서 다룬다.


참고 자료: https://www.bradyneal.com/causal-inference-course

Footnotes

  1. 참고로, 모든 사람을 평균내는 ATE와 달리, 특정 특성()을 가진 집단 내에서의 평균 효과를 CATE (Conditional Average Treatment Effect) 라고 한다. 예를 들어, 20대 집단에서의 타이레놀 효과는 처럼 표현할 수 있다.