'죄수의 딜레마' vs '안보 딜레마' vs '팃포탯'

남북의 군비경쟁은 서로에게 이익이 되지 않음에도 왜 중지되지 않을까? 게임이론의 설명에 따르면 남북의 군비경쟁은 죄수의 딜레마와 유사한 불합리한 결과를 낳을 가능성이 크며, 이는 결과적으로 안보 딜레마를 부른다고 한다.

죄수의 딜레마와 안보딜레마는 무엇인가? 그리고 이를 위한 해결책으로 이야기되는 팃포탯은 무엇일까?

죄수의 딜레마(prisoner’s dilemma)와 안보 딜레마(security dilemma)

1948년 설립된 미국 랜드(RAND)연구소는 ‘게임이론’의 산실 노릇을 했다. 여기서 개발된 게임이론 가운데 가장 유명한 것이 ‘죄수의 딜레마’다. 죄수의 딜레마라고 이름을 붙인 건 수학자 앨버트 터커(Albert W. Tucker)다.

죄수의 딜레마는 범죄 혐의를 받는 두 사람이 각각 다른 방에서 심문을 받는 상황을 가정한다. 두 사람이 모두 범죄를 부인하면 둘 다 최소 형량을 받게 되지만, 둘 다 자백하면 최대 형량을 나눠서 지게 된다.

이런 상황에서 각각의 죄수는 상대방이 어떤 선택을 할지 알 수 없기 때문에, 가장 합리적이라고 판단한 ‘자백’을 선택한다. 그러나 둘의 형량을 합치면 최대가 돼 전체로 보면 최악의 선택을 한 결과가 되고 만다.

배반을 통해 얻을 수 있는 이득이나 혹은 배반을 당함으로써 받게 될 불이익을 피할 수 있다는 점에서 배반은 최적의 선택일 수 있다. 그러나 게임이론가인 폰 노이만(John von Neumann)은 지속적인 의사소통과 인간관계를 고려할 때 온전한 죄수의 딜레마는 존재하기 힘들다고 지적했다.

한편, 이 ‘죄수의 딜레마’는 국제 정치에서 ‘안보 딜레마’ 상황을 설명하는 데 유력하게 쓰인다. 고대 그리스의 투키디데스가 안보딜레마를 지적한 이래 마키아벨리, 토마스 홉스, 한스 모겐소를 거쳐 헨리 키신저까지 수많은 국제정치 거장들의 지지를 받아왔고 지금도 국제정치를 설명하는데 상당한 힘을 발휘하고 있다.

한 나라가 안보를 튼튼하게 하려고 군사력을 증강하면 불안해진 상대국도 군사력을 늘리기 마련이다. 양쪽이 서로 작용-반작용의 군비 경쟁을 벌인 결과 안보가 모두 취약해지는 역설적 상황이 벌어진다. 국제정치학에서 말하는 ‘안보 딜레마’(security dilemma)다.

안보 딜레마는 힘의 우위를 통해 안보를 추구할 때 자주 나타난다. 공교롭게 남북은 모두 힘이 뒷받침된 평화를 강조한다. 군사력을 증강하면서 상대국을 공격하겠다고 위협하는 나라는 없다. 다들 방어 목적이고 평화를 지키기 위해서라고 한다. 현실에서는 한쪽이 군사력을 키우면 다른 쪽이 방어 목적인지 공격 목적인지 몰라 불안해진다.

이런 안보 딜레마의 해법은 두 가지가 있다. 첫째, 상대방보다 완벽한 힘의 우위를 확보해 철통같이 안보를 지키는 방법이다. 하지만 돈이 너무 많이 들고 모든 위협을 완벽하게 막기는 불가능하다. 둘째, 상호 신뢰에 기반한 군비 통제다. 안보 딜레마의 시작인 불안감은 군사적 대립의 결과이다.

팃포탯(tit for tat)

1980년 미국 정치학자 로버트 액설로드(Robert Axelrod)는 죄수의 딜레마를 게임으로 만들어, 인간이 왜 협력하는지 설명해냈다. 1회성으로 끝나지 않는 계속적인 상호작용을 모형화하여 ‘반복적 죄수의 딜레마 게임(iterated prisoner’s dilemma game)’를 만들었다.

이 게임에서 양쪽 모두 협력할 경우 각 3점, 한쪽 협력, 다른 쪽 배신엔 0점과 5점, 양쪽 모두 배반 땐 각 1점씩을 주고, 최다득점자가 우승하는 컴퓨터게임 대회를 열었다. 우승자는 맞대응이라는 뜻의 팃포탯 전략이었다.

‘tit과 tat’은 ‘가볍게 치기’를 의미한다. ‘tit for tat’은 ‘상대가 치면 나도 친다’는 뜻이다. ‘되갚음, 응징, 보복’이라고도 할 수 있다. ‘오는 말이 고와야 가는 말이 곱다’는 속담이나 ‘눈에는 눈, 이에는 이(an eye for an eye, a tooth for a tooth)’라는 말이 여기에 해당한다.

‘동태복수법’(同態復讐法)의 원조인 고대 바빌로니아 함무라비 법전의 대원칙이다. 실제로 이 법전에는 “평민이 귀족의 눈을 멀게 했으면 제 눈을 멀게 한다”(196조), “평민이 귀족의 뼈를 부러뜨렸으면 제 뼈를 부러뜨린다”(197조) 같은 조문이 여럿 나온다. 상대방이 하는 대로 되갚아 주는 것이 팃포탯이다.

그 원칙은 다음과 같다. 1) 협력: 상대가 협력하면 무조건 협력하고 불필요한 갈등을 일으키지 않는다. 2) 응징: 상대의 예상치 않은 배반에는 즉각 보복한다. 3) 용서: 상대의 도발을 응징한 후에는 용서한다. 4) 행동의 명확성: 상대가 내 행동 패턴에 적응할 수 있도록 명확하게 행동한다.

팃포탯은 상대보다 한 번도 더 좋은 점수를 얻지 못했다. 하지만 최종 누계에선 최고의 점수를 획득했다. 모든 상대에게서 협력을 이끌어냈기 때문이었다. 배반은 반드시 응징당하고 협력은 반드시 보상받는, 이 프로그램 앞에서 모든 상대는 협력을 선택했다.

액설로드는 이에 따라 협력은 우정이나 탁월한 계산력이 없이도 작동되며, 심지어 적과도 가능하다고 결론을 내렸다. 중요한 것은 인내심이다.

하지만 문제점도 있다. 상대가 배반을 계속하면 영원히 상황이 바뀌지 않게 된다. 실제 상황에서는 도중에 전쟁이 일어날 가능성이 크다. 게임 종료를 앞두고 상대가 배반할 때에도 대책이 없다.

저작자표시 비영리 변경금지 (새창열림)

'World Politics' 카테고리의 다른 글

치킨게임과 국제정치 (1)	2022.08.08
유엔 안보리의 구성과 개혁방안 (0)	2022.08.08
'다누리'의 달 탐사와 ‘헬륨-3’ (0)	2022.08.05
중국 vs 대만, 대만해협 위기의 역사 (0)	2022.08.03
공식적/비공식적 핵보유국 구별은 NPT (0)	2022.07.31
예루살렘과 ‘두 개의 국가 해법’ 그리고 팔레스타인 (1)	2022.07.20
하이퍼루프 개발 현황과 한국의 기술력 (0)	2022.07.14
일본 헌법9조와 군사대국화 움직임 (0)	2022.07.10