죄수의 딜레마

위키백과, 우리 모두의 백과사전.
둘러보기로 가기 검색하러 가기
Prison.jpg

죄수의 딜레마(罪囚-, prisoner's dilemma, PD)는 게임 이론의 유명한 사례로, 2명이 참가하는 비제로섬 게임 (non zero-sum game)의 일종이다. 이 게임은 용의자의 딜레마 또는 수인의 번민(囚人의 煩悶)이라고도 부른다. 이 사례는 협력할 경우 서로에게 가장 이익이 되는 상황일때 개인적인 욕심으로 서로에게 불리한 상황을 선택하는 문제를 보여주고 있지만 이후 이러한 딜레마의 '반복되는 죄수의 딜레마'로 지속적으로 일어날 경우 긍정적인 협동이 가장 최선의 선택지가 된다는 사회행동의 전략적 진화를 보여준다.[1]

일반적인 예[편집]

상황은 다음과 같다. 두 명의 사건 용의자가 체포되어 서로 다른 취조실에서 격리되어 심문을 받고 있다. 이들에게 자백여부에 따라 다음의 선택이 가능하다.

  • 둘 중 하나가 배신하여 죄를 자백하면 자백한 사람은 즉시 풀어주고 나머지 한 명이 10년을 복역해야 한다.
  • 둘 모두 서로를 배신하여 죄를 자백하면 둘 모두 5년을 복역한다.
  • 둘 모두 죄를 자백하지 않으면 둘 모두 6개월을 복역한다.
구 분 죄수 B의 침묵 죄수 B의 자백
죄수 A의 침묵 죄수 A, B 각자 6개월씩 복역 죄수 A 10년 복역, 죄수 B 석방
죄수 A의 자백 죄수 A 석방, 죄수 B 10년 복역 죄수 A, B 각자 5년씩 복역

균형[편집]

  • 죄수A의 선택 : 죄수B가 침묵할 것으로 생각되는 경우 자백을 하는 것이 유리하다. 죄수B가 자백할 것으로 생각되는 경우 자백이 유리하다. 따라서 죄수A는 죄수B가 어떤 선택을 하든지 자백을 선택한다.
  • 죄수B의 선택 : 죄수A와 동일한 상황이므로, 마찬가지로 죄수A가 어떤 선택을 하든지 자백이 유리하다.
  • 균형 : 죄수 A, B 는 모두 자백을 선택하고 각각 5년씩 복역한다.

이 게임의 죄수는 상대방의 결과는 고려하지 않고 자신의 이익만을 최대화한다는 가정 하에 움직이게 된다. 이때 언제나 협동(침묵)보다는 배신(자백)을 통해 더 많은 이익을 얻으므로 모든 참가자가 배신(자백)을 택하는 상태가 내쉬 균형이 된다. 참가자 입장에서는 상대방의 선택에 상관없이 자백을 하는 쪽이 언제나 이익이므로 합리적인 참가자라면 자백을 택한다. 결국 결과는 둘 모두 5년을 복역하는 것이고, 이는 둘 모두가 자백하지 않고 6개월을 복역하는 것보다 나쁜 결과가 된다.

게임의 확장[편집]

죄수의 딜레마 게임은 두 죄수가 서로 의사소통을 할 수 있다면 얘기는 약간 달라진다. 보통은 약속을 깨버리는 경우가 많지만 일부의 경우 둘다 발설해서 생길 결과를 예측하는 경우도 있어 약속을 지키는 경우도 존재한다.

죄수의 딜레마 게임은 행위자가 두 명이 아니라 N 명이 참가하는 경우에도 역시 동일한 결과가 나온다. 자신을 제외한 나머지 행위자가 침묵과 자백 중 어떠한 선택을 하더라도 개인 행위자 입장에서는 언제나 자백을 선택하는 것이 유리하기 때문에 결국 모든 행위자들이 자백을 선택하게 된다.

의미[편집]

'죄수의 딜레마 게임'은 정부의 존재 이유를 정당화하는 이론적 근거의 하나로 사용되기도 하지만 한편으로는 '협동'이라는 사회적 진화가능성을 설명할수있는 이론으로 제시되기도 한다. 아담 스미스 등의 자유주의 시장 경제 이론에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하는 경우 비록 정부의 역할이 없더라도 시장이라는 보이지 않는 손에 의해 균형이 달성되어 사회적으로 가장 바람직한 결과가 나오게 된다. 하지만 죄수의 딜레마 게임에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하는 경우 모든 사람들에게 최악의 결과가 생긴다. 이러한 결과는 게임 참여자 중 어느 누구도 원하지 않았던 결과이며, 행위자들끼리 자발적인 의사소통과 약속 등의 방법을 통해서는 결코 해결할 수 없다. 결국 정부 또는 국가라는 외부의 행위자가 개입하여 법률, 제도, 세금 등의 방법으로 각 행위자의 행동을 강제해야만 사회적으로 바람직한 결과가 도출될 수 있다는 이론이다.

한편 '반복되는 죄수의 딜레마'(Iterated Prisoner's Dilemma)는 아주 단순한 메커니즘을 갖는 팃포탯 전략의 실험을 통해서 죄수의 딜레마가 지속적으로 반복되는 경우 최적의 선택은 결국 협동이라는 양상의 사회행동임을 연구발표한바있다.

국제정치학에서의 응용[편집]

신자유주의, 특히 신자유제도주의론자들은 이 죄수의 딜레마를 이용해 여러 경우의 국제 관계에서 나타나는 문제들을 이론적으로 정형화시키려 노력해왔다. 특히 이 죄수의 딜레마를 이용한 해석은, 특히 비합리적으로 보이는 문제들이 어째서 합리적으로 설명될 수 있느냐에 초점을 맞춰왔다. 예를 들어, 왜 개별 국가들이 세계적인 환경을 해치고, 자원을 남획하며, 분쟁 지역에 무기를 판매하는가에 대한 설명의 준거로 활용되어 왔다. 상위 정부가 없는 개별국가간의 국제체제에서 상대 국가의 전략이 항상 협동적으로 나올 것으로 기대할 수 없기 때문에, 개별국가들은 각자 자신의 이익을 추구하게 된다. 신자유 제도주의자들은 이 결과 국가들은 협동의 필요성을 절감하게 되고, 협동에 대한 확신을 얻을 수 있게 하기 위해, 개별국가에 우선하는 국제 레짐의 등장을 필요로 하게 될 것이라 전망하고 있다.

같이 보기[편집]

참고 문헌[편집]

  1. [참고](The Evolution of Cooperation Robert Axelrod and William D. Hamilton )http://www-personal.umich.edu/~axe/research/Axelrod%20and%20Hamilton%20EC%201981.pdf
  • Keohane, R. O. (1984), After Hegemony : Cooperation and Discord in the World Political Economy (Princeton:Princeton Univercity Press.)
  • 존 베일리스, 스티브 스미스 편저 - 하영선 외 옮김 (2006), "세계정치론(The Globalization of World politics, 3rd edition) ISBN 89-324-7099-5