본문 바로가기
scribbles

해리포터와 인과관계 추론의 어려움

by 고이난 2021. 6. 8.

영상 출처: 해리포터 1편; 유투브 "쥬시가십" 채널

 

얼마 전, 해리포터 전편을 요약한 한 유투브 영상에서 이 유명한 장면을 보고 떠오르는게 있었다. 롤링 작가의 천재적인 떡밥의 중심에 있는 스네이프 교수에 대한 전세계적 비호감을 이끌었던 기념비적인 장면. 해리포터가 생애 첫 퀴디치에 출전한 날, 갑자기 중심을 잃고 공중에서 휘청거리는 빗자루에 이어 관중석에서 망원경으로 보고 있던 헤르미온느가 스네이프 교수가 주문을 외우고 있는 것을 포착한 장면이다. 이에 헤르미온느는 스네이프 교수가 해리를 방해하고 있다고 생각하고 그가 앉아있는 관중석 밑으로 들어가 주문으로 불을 지른다. 그러자 스네이프 교수는 불을 끄기에 바쁘고 해리포터의 빗자루는 정상으로 돌아온다.

 

그러나 모두가 다 알듯이 (설마 모르는 사람도 있나) 범인은 스네이프 교수가 아닌 그의 뒤에 앉아있는 퀴렐 교수. 예전에 볼 땐 몰랐는데 퀴렐 교수도 두 손을 모으고 속으로 주문을 외우고 있는 것 같은 포즈를 취하고 있다.

 

만약 롤링이 우리에게 끝까지 이러한 사건의 전말을 알려주지 않았다면, 우리는 과연 어떤 근거로 스네이프 교수가 범인이 아닐 수도 있음을 알아낼 수 있을까?

 

이를 형식적으로 나타내보자 (도대체 왜).

 

-

 

먼저, 임의의 한 순간에 해리의 빗자루 상태를 Y (potential outcome), 빗자루를 방해하는 주문의 효과를 T (treatment)라고 하자. 그리고 주문이 있을 경우의 해리의 빗자루 상태는 Yt (휘청거림), 그리고 주문이 없을 경우의 해리의 빗자루 상태는 Yc (멀쩡함) 이다. 이 경우 우리는 해리의 빗자루 상태를 다음과 같이 정의할 수 있다.

 

Y = Yt  when  T = 1

Y = Yc  when  T = 0

 

즉, 주문의 효과가 있을 경우에 (T=1) 해리의 빗자루 상태는 휘청거림, 즉 Yt가 되고, 주문의 효과가 없을 경우에는 (T=0) 정상이 된다 (Yc). 해리의 빗자루는 "동시에 휘청거리거나 정상일" 수 없으므로 이 두 가지 상태는 완벽하게 상호 배타적이다.

 

만약 해리 뿐만이 아닌 "모든 마법사"들의 빗자루로 대상을 확장한다면 우리는 이를 정의하기 위해 여기에 두 가지 전제를 더 필요로 하게 된다.

 

1. SUTVA (stable unit treatment value assumption). 어떤 마법사에게만 주문에 가해져서 빗자루가 휘청거리게 될 때, 다른 마법사에게는 그 영향이 끼치지 않을 것. 예컨대 해리와 론이 동시에 공중에서 빗자루를 타고 있을 때, 누군가가 해리에게 주문을 걸어서 빗자루를 휘청거리게 하면 론의 빗자루를 휘청거리게 하지 못해야 한다는 것이다. 더 정확하게는 "휘청거리건 말건 상관이 없어야 한다"가 맞겠다.

 

2. Homogenous treatment effect. 어느 마법사건 주문의 효과를 받은 즉시 빗자루는 휘청거려야 한다. 예컨대 해리에 비해 론이 더 무거워서(...), 주문의 효과을 받더라도 빗자루가 즉시 휘청거리지 않거나 아예 휘청거리지 않는다면 이러한 전제에 위반된다. 누구에게든 주문의 효과은 동일하고 즉각적이어야 한다. 

 

-

 

지금부터는 가정과 전제의 영역이 아니라 관찰한 것을 바탕으로 설정한 가설의 영역이다. 이제 스네이프 교수를 이 재미없는 설명에 추가해보자. 임의의 한 순간에 스네이프의 상태를 S라고 하자. 스네이프는 주문을 외울수도, 외우지 않을 수도 있다. 이를 각각 St, Sc라고 표현해보자. 우리는 St를 관찰한 이후에 Sc를 관찰했고, (스네이프는 주문을 외우다가 그만두었으므로), 따라서 다음과 같은 가설을 세울 수 있다.

 

T = 1 when S = St;  therefore, Y = Yt

T = 0 when S = Sc;  therefore, Y = Yc

 

즉, 스네이프가 주문을 걸자 (S=St), 해리에게 주문 효과가 가해졌고 (T=1), 해리는 휘청거렸다 (Y=Yt). 반대로, 스네이프가 주문을 걸지 않자 (S=Sc), 해리에게 주문 효과가 가해지지 않았고 (T=0), 해리는 정상으로 돌아왔다 (Y=Yc). 따라서 스네이프가 주문을 걸었기 때문에 해리가 휘청거린 것이다. 

 

따라서 연구가설 (이게 연구일 것 까지야) 혹은 주장을 요약하면 "스네이프가 주문을 걸어 해리의 빗자루가 휘청거렸다"이다. 이 가설이 틀릴 수 있는 경우는 다음의 세 가지 경우이다. 

 

 

1. 스네이프가 주문을 건게 아니다. 이는 S가 St와 Sc로 애초에 나뉘어질 수 없다는 의미이다. 스네이프가 주문을 걸고 있는 것처럼 보였지만, 사실은 그냥 단어를 암기하고 있었을 가능성이 있다는 것이다. 이를 우리는 측정 오류 (measurement error)라고 한다. 어떤 현상을 잘못 관측해서 그 현상에 변화(variation)가 있다고 착각하고, 이를 우리가 관심있는 결과물의 변화와 연결지었기 때문에 인과관계를 잘못 추정하는 오류이다. 

 

2. 스네이프가 주문을 건 것은 맞지만, "빗자루 혼돈 주문"을 건게 아니다. 즉, S와 T 간에 관계가 없다. S가 St와 Sc로 나뉘어질 수는 있지만, 그것이 T가 1이거나 0일 경우와는 관련이 없다는 것이다. 이 경우는 허위적 인과관계 (spurious relationship) 라고 한다. 

 

3. 스네이프가 "빗자루 혼돈 주문"을 건게 맞지만, 그렇다고 해서 해리의 빗자루가 휘청인 것은 아니다. 이 경우 우리는 Y와 T, 그리고 St를 조금 더 세밀하게 정의해야 할 필요가 있다. 만약 St*가 "빗자루 혼돈 주문"의 올바른 영창 (주문을 외는 방법)의 척도라고 한다면:

 

Y = Yc + T (Yt - Yc) + u

T* = St* + v

T=1  if  T* >=0  and   T=0  if  T*<0

 

즉, T*는 "빗자루 혼돈 주문(T)"의 잠재 효과 (latent treatment effect)로, 그 크기가 일정 이상 되어야 주문의 효과를 볼 수 있다. 편의상 이 글에서는 그 경계선을 0으로 정한다. 즉, 주문의 잠재 효과가 0 이상이어야만 주문이 해리에게 효과를 발휘한다 (T=1)는 것이다.

 

여기서 재밌는 것은 u와 v이다. u는 우리가 당시 영화 장면에서 관찰하지 못한 해리의 특성 중에 해리의 빗자루 상태에 영향을 주는 것들을 말한다. 대표적으로 해리의 무게, 주문 저항 능력 등이 있을 수 있다. v는 당시 영화 장면에서 관찰하지 못한 스네이프의 특성 중에 빗자루 혼돈 주문의 잠재 효과에 영향을 주는 것들을 말한다. 대표적으로 스네이프의 마법력 (이라는게 해리포터 세계관에 있다면), 그날의 컨디션 등이 있다. 

 

Y는 처음에 정의한 것과 조금은 다르지만, 편의상 "휘청거림의 정도"라고 하자. 따라서 Yt와 Yc의 관계는 완벽하게 배타적이지 않게 된다. 그렇다면 Yt > Yc로 정의하자. 

 

이 경우에는 위에서 제시한 주장이 틀릴 세 가지 가능성이 추가로 제기된다. 

 

  1)  St*가 충분히 크지 않았을 때. 예컨대 스네이프가 주문을 일부 잘못 외웠다.

  2)  u와 v 간에는 관계가 없지만, St*와 u 간에 관계가 있을 때. 예컨대 해리에게 뭔가 마법 방어 주문 같은 것이 걸려 있어서 스네이프가 자꾸만 주문 외우는 것을 틀렸다.

  3)  u와 v 간에 관계가 있을 때. 예컨대 바로 위에서 언급한 해리의 마법 방어 주문이 스네이프의 주문 영창 방법에는 영향을 주지 않았지만 그 반작용으로 스네이프의 컨디션을 떨어뜨렸다. 

 

위의 세 가지 경우 중 하나라도 사실이라면, 스네이프의 주문 "때문에" 해리의 빗자루가 휘청거린게 아니라는 결론을 내릴 수 있다. 물론 스네이프는 나쁜 사람이 되겠지만. 

 

-

 

만약 우리가 영화를 7편까지 다 봤다면 스네이프가 "빗자루 혼돈 주문'을 건게 아니었다는 것, 즉 위에서 언급한 2번의 경우가 사실이었음을 알 수 있다. 오히려 해리를 보호하는 주문을 걸고 있었다는 것. 따라서 헤르미온느가 불을 붙였을 때, 스네이프가 아닌 옆에 있던 퀴렐 교수가 주문을 방해받았기 때문에 해리의 빗자루가 멀썽하게 돌아올 수 있었다. 그러나 다음의 경우를 생각해보자.

 

  A) 만약 퀴렐 교수가 스네이프 곁에 없었을 때, 헤르미온느가 불을 붙였다면? 이 경우 스네이프는 불을 끄기 위해 주문을 그만둘 것이고, 해리는 여전히 휘청이고 있을 것이다. 이 경우 필요조건을 충족하지 못해 스네이프가 범인이 아니었다는 것을 알 수 있다. 즉, 스네이프가 필요조건이라면 스네이프가 주문을 그만두는 즉시 해리의 빗자루도 휘청거림을 그만두어야 할텐데, 그렇지 않았다. 

 

  B) 만약 퀴렐 교수가 스네이프와 함께 있었지만, 스네이프는 불이 난 줄도 모르고 퀴렐 교수만이 불을 끄느라 주문을 그만두었다면? 스네이프는 주문을 계속 걸고 있겠지만 해리는 휘청거림을 멈출 것이다. 이 경우 충분조건을 충족하지 못해 스네이프가 범인이 아니었다는 것을 알 수 있다. 즉, 스네이프가 충분조건이라면 스네이프가 주문을 지속하고 있다면 해리의 빗자루도 지속적으로 휘청거려야 할텐데, 그렇지 않았다. 

 

-

 

영화 시청자들은 스네이프가 범인이 아니었다는 점에서 충격을 받을 것이지만, 진짜 범인은 누구인지 알 수 없을 것이다. 만약 위의 두 가지 경우 때문에 헤르미온느가 계속 범인을 추적한다고 가정해보자. 그러다가 마찬가지로 관람석에서 의심스러운 한 마법사를 발견했다고 하자. 그러나, 이 마법사가 범인인지 아닌지를 아는 것 역시 매우 어려운 일이다. 

 

다시 3번의 2), 3)의 경우를 생각해보자. 

 

  2)  u와 v 간에는 관계가 없지만, St*와 u 간에 관계가 있을 때. 예컨대 해리에게 뭔가 마법 방어 주문 같은 것이 걸려 있어서 스네이프 (여기서는 해당 마법사) 가 자꾸만 주문 외우는 것을 틀렸다.

  3)  u와 v 간에 관계가 있을 때. 예컨대 바로 위에서 언급한 해리의 마법 방어 주문이 스네이프 (여기서는 해당 마법사) 의 주문 영창 방법에는 영향을 주지 않았지만 그 반작용으로 스네이프 (여기서는 해당 마법사) 의 컨디션을 떨어뜨렸다. 

 

2)번의 경우가 사실이라면, 우리는 의심스러운 마법사가 자꾸만 주문을 외우다 말고 외우다 말고 하는 것을 보며 혼란스러워 할 것이다. 왜냐하면 해리에게 걸린 마법 방어 주문 때문에 해당 마법사가 주문을 자꾸만 중간에 그만두거나 아예 입밖으로 주문을 외우지 않았을 수 있기 때문이다. 해당 마법사는 주문을 자꾸만 그만두었음에도 불구하고 본인의 마법력이 너무도 강력해서 해리에게 충분한 위해를 가했을 수도 있다. 그러나 우리는 해당 마법사가 주문을 완벽하게 구사하지 않았기 때문에 범인이 아닐 거라고 결론내릴 수 있다. 이와 같이 방금 색출한 사람을 "해리에게 실제 위해를 가한 범인이 아니다"는 그릇된 결론 (1종 오류) 을 내리는 경우를 "관찰 가능한 지표로 인한 선택 편이 (selection on the observables)"라고 한다. 주문을 외우는 것은 망원경으로 관찰 가능하기 때문이다. 

 

혹은 3)번의 경우가 사실이라면, 우리는 의심스러운 마법사가 보다 더 수월하게 주문을 외우는 것을 볼 수 있고, 그 때문에 해리의 빗자루가 휘청거렸다고 단정지을 수 있다. 그러나 이 마법사 때문에 해리의 빗자루가 휘청거렸다고 보기는 어렵다. 왜냐하면 해당 마법사가 완벽하게 주문을 걸었다 하더라도 해리의 마법 방어 주문이 해당 마법사의 마법력을 낮추어 주문의 잠재적 효과 (T*)가 낮을 수 있기 때문이다. 이 때문에 주문이 발휘되지 않았을 가능성, 즉 T=0일 가능성이 있다는 것이다. 따라서 해리의 빗자루를 휘청거리게 하고자 한 사람을 색출해낼 수는 있겠지만, 정말 해리에게 위해를 가한 범인은 아직 관람석에 남아있을 수 있다 (불쌍한 해리...). 이와 같이 방금 색출한 사람을 "해리에게 실제 위해를 가한 범인이다"는 그릇된 결론 (2종 오류) 을 내리는 경우를 "관찰 불가능한 지표로 인한 선택 편이 (seletion on the unobservables)"라고 한다. 해리에게 걸린 마법 방어 주문으로 인한 마법사의 컨디션 저하는 관찰 불가능하기 때문이다. 

 

-

 

이상의 경우를 통해 우리는 3번의 경우, 즉 관찰 불가능한 지표로 인한 선택 편이 때문에 퀴렐 교수를 범인으로 알아차릴 수 없었다는 것을 알 수 있다. 물론 주문은 음성으로 구사해야 더 강력하다는 해리포터 세계관을 고려하고, 스네이프가 모종의 방어 주문을 해리에게 걸어주어 퀴렐 교수가 입을 꾹 다문채 주문을 걸 수 밖에 없었다는 것을 가정했을 때 그렇다. 그래서 스네이프 때문에 오히려 범인 색출이 어려워질 수도 있는 것이다 (!!! 이렇게 영화의 재해석을). 퀴렐 교수가 저렇게 두 손 모은 채 속으로만 주문을 외운 것이 단순한 소설 속, 혹은 영화 속 설정일 수도 있겠지만, 어쩌면 롤링 작가는 관찰 가능한 지표로 인한 선택 편이를 보는 이로 하여금 저지르도록 치밀하게 계획한 것이 아닐까?

 

영화에서든 현실에서든, 어떤 현상을 보고 "인과관계"라고 확답을 내릴 수 있는 경우는 매우 드물다. 다만 인과관계가 아닐 가능성을 끊임없이 반증해가며 그에 가깝게 추론해낼 뿐이다. 그래서 "인과관계 추론"이다. 

 

-

 

참조 1) T*의 값을 결정짓는 St*는 정확하게는 관찰 대상의 내생적인 변수가 아닌 외생적인 변수 (exogenous variable) 이어야 한다. 이 글에서는 설명의 편의성을 위해 내생적인 변수로 예시를 들었다. 

참조 2) 위에서 언급한 두 가지 선택편이는 반드시 1종 혹은 2종 오류와 필연적으로 연결되지 않는다. 어느 편이건 간에 어떤 종류의 오류와도 연계될 수 있다.

 

 

참고자료

Winship, Christopher, and Stephen L. Morgan. 1999. The estimation of causal effects from observational data. Annual Review of Sociology 25: 659-706. 

댓글