[경제레시피] 이세돌 은퇴 대국 앞두고 바라본 ‘바둑 인공지능’의 세계

▲이세돌 9단이 2016년 서울 종로구 포시즌스호텔에서 열린 '구글 딥마인드 챌린지 매치'에서 대국을 하고 있다. (사진제공=구글)

"저는 바둑을 예술로 배웠는데, 인공지능(AI)이 나오면서 이걸 예술로 볼 수 있을까 하는 생각이 들더라고요. 그런 점이 은퇴 이유 중 하나가 된 것 같네요." (이세돌 9단의 JTBC 뉴스룸 인터뷰 중)

세계 최고 바둑 AI 프로그램 '알파고'를 상대로 유일한 승리를 거둔 인간인 이세돌 9단이 전격 은퇴를 선언했다. 지난달 19일 서울 한국기원을 방문해 사직서를 제출한 이세돌 9단은 이달 18일과 19일, 21일 3일간 국내 기술로 만들어진 바둑 AI 프로그램 '한돌'과 은퇴 대국을 펼친다.

이번 은퇴 대국은 3번기 치수고치기로 진행된다. 치수고치기란 두 대국자 사이의 기력 차이를 조정하기 위해 두는 바둑으로 대국 결과에 따라 정해진 규칙에 따라 치수를 조정한다. 이세돌 9단은 흑을 잡고 두 점을 깔고 시작하며, 백돌을 잡은 한돌은 덤 7집 반을 받는다.

1국에서 이세돌 9단이 이기면 2국에서 이세돌 9단과 한돌은 호선으로 둔다. 2국에서 이세돌 9단이 패하면 다시 두 점 접바둑을, 승리하면 3국에서 한돌이 흑을 잡고 두 점을 깔고 시작한다.

반면, 1국에서 이세돌 9단이 지면 2국에서 석 점을 깔고 시작한다. 2국에서도 패하면 3국에서 넉 점을 깔고 대결한다.

이세돌 9단은 은퇴 대국에서 기본 대국료 1억5000만 원을 받고 1승마다 5000만 원의 승리 상금을 받는다.

(사진제공=NHN)

이세돌 9단은 현역 생활을 하면서 18차례 세계대회 우승과 32차례 국내대회 우승 등 총 50번의 우승컵을 차지했다. 그가 기록한 상금만도 한국기원 공식 집계로 98억 원에 달한다.

그의 바둑 인생에서 가장 주목받은 것 중 하나는 바로 2016년 구글 딥마인드의 바둑 AI 프로그램 알파고와의 대결이었다. 당시 이세돌 9단은 알파고와의 대국에서 1승 4패로 패했지만, 지금까지도 알파고를 상대로 승리를 거둔 인류 유일의 프로기사로 기록됐다. 4번째 대국에서 알파고의 허점을 제대로 짚은 백 78수는 '신의 한 수'로 기억되고 있다.

당시 알파고와의 대국에서 이세돌 9단의 기본 대국료는 5국 모두를 두는 조건으로 15만 달러(약 1억7400만 원)를 받았다. 여기에 승리수당은 1국 승리 시마다 2만 달러(약 2300만 원)였다. 이세돌 9단은 1승을 거둬 2만 달러의 승리수당을 챙겼다. 우승 상금으로는 100만 달러(약 11억6400만 원)가 주어졌는데, 알파고가 우승하면서 해당 금액은 유엔 아동기금 및 STEM(과학·기술·공학·수학) 교육 및 바둑 관련 자선단체에 기부됐다.

이세돌 9단은 자신의 마지막 대국도 AI와의 승부로 마무리하려 한다. 어쩌면 '40세까지 바둑을 하고 싶었다'는 그의 바람을 무너뜨린 알파고와의 만남을 '한돌'과의 대국을 통해 대신 풀려고 하는지도 모른다.

◇2010년부터 눈부신 바둑 AI의 도전…AI의 상대는 AI밖에 없다?

인간계 최고의 바둑기사였던 이세돌 9단을 좌절시켰을 정도로 바둑 AI 프로그램은 빠르게 성장하고 있다.

사실 바둑 AI 프로그램은 2010년대 이전까지만 해도 초보적인 단계에 머물렀다. 1980년대 패미컴으로 개발된 바둑 AI 엔진은 괴이한 수를 연발했고, 바둑은 워낙 '경우의 수'가 많기에 AI의 한계가 존재한다는 주장도 나왔다.

하지만, 2008년 몬테카를로 알고리즘을 적용한 'MOGO'라는 프로그램이 알려지면서 비약적인 발전을 하고, 모든 바둑 AI 프로그램은 몬테카를로 방식으로 전환되기 시작했다.

이후 이세돌 9단이 2016년 맞대결을 펼친 구글 딥마인드의 '알파고'의 등장으로 또 한 차례 세대교체가 이뤄졌다. 알파고 성공의 핵심에는 '딥러닝'이라는 기술이 있었다. 컴퓨터는 복잡한 연산 과정을 거쳐야만 이해할 수 있는데, 수많은 데이터를 입력한 뒤 비슷한 것들끼리 분류해서 사람을 사람으로, 로봇을 로봇으로 판독하도록 훈련하는 방식을 기계 학습이라고 한다. 기계 학습 방식 중에서 학습 데이터를 구분하는 층을 많이 만들어서 그 정확도를 올리는 방법을 '딥러닝'이라고 한다. 딥러닝은 단순히 선이나 색만 구분한다면 나중에는 모양을 인식하고, 이후 추상적인 레벨까지 구분할 수 있다.

이런 딥러닝 기술을 탑재한 바둑 AI 프로그램의 등장으로 바둑 AI는 프로 기사들과 상대해도 승리할 수 있을 정도의 실력을 갖추게 됐다.

세계 최고 바둑 AI 프로그램 '알파고'는 '알파고 팬(AlphaGo Fan)'에서 '알파고 리(AlphaGo Lee)', '알파고 마스터(AlphaGo Master)', '알파고 제로(AlphaGo Zero)'에 달하기까지 업그레이드된 모델이 나오면서 급격히 성장하고 있다.

알파고는 2016년 3월 15일 한국기원으로 부터 명예 프로 9단 단증을 받아 알파고 9단이 됐다. 객원기사 자격으로 한국기원에 등록됐기 때문에, 언제든지 한국기원에서 개최하는 대회에 참가할 수도 있다.

머신러닝 기반 바둑 프로그램인 알파고는 자기 자신과의 자가 대국을 통한 학습도 가능하다. 다른 바둑 AI 프로그램과 대결에서 495전 494승 1패의 전적을 기록할 정도로 세계 최고의 바둑 AI 프로그램으로 군림하고 있다.

중국 텐센트에서 개발한 바둑 AI 프로그램 '절예(FineArt)'도 알파고 이후 강자로 주목받고 있다. 텐센트에서는 2010년대 초반부터 바둑 AI 프로그램을 개발하고 있었지만, 뾰족한 성과를 내지 못했다. 이후 구글 딥마인드가 공개한 알파고 제로의 논문을 참고, 알파고식 인공신경망 체제인 '제로 계열'로 변경하면서 급속한 기력 향상을 보이고 있다.

특히 막강한 자본력을 바탕으로 최강의 기력을 소유한 바둑 AI 프로그램으로 주목받고 있다. 올해 종신증권배 AI 바둑대회에서 우승을 차지한 바 있다.

일본 드왕고·도쿄대학·일본기원에서 개발한 '딥젠고(DeepZenGo)'는 2016년 알파고의 성공 이후 일본의 바둑 프로그램 '젠'에 딥러닝 방식을 도입한 결과물이다.

딥젠고는 바둑 AI를 오랜 기간 개발해온 젠에 소프트웨어 기업 드왕고와 도쿄대학까지 가세한 프로젝트였지만, 2018년 이후 구글 딥마인드가 발표한 논문을 바탕으로 알파고 제로나 알파제로를 모방한 제로 계열 오픈소스 바둑 AI 프로그램이 잇따라 출현하자 은퇴를 선언했다.

딥젠고의 프로기사를 상대로 한 공식전 전적은 8전 3승 5패, 은퇴국까지 포함하면 11전 5승 6패다.

국내 대표 바둑 AI 프로그램으로는 '돌바람'이 있다. 돌바람네트웍스 임재범 대표가 개발한 '돌바람'은 중국에서 열린 세계컴퓨터 바둑대회에서 젠을 꺾고 우승을 차지한 바 있다.

NHN이 한돌을 내놓기 전까지 사실상 유일한 국산 바둑 AI 프로그램으로, '한국형 알파고'라고도 불렸다. 다만 기업이나 국가의 지원 없이 개인적으로 개발하고 있는 프로그램이라 그 성장 면에서는 다소 저조하다고 할 수 있다.

지난해부터 한국기원 및 바둑TV와 협약을 맺고 바둑TV 중계 시 돌바람 형세판단이 사용되고 있다. 한 수 진행될 때마다 승률 기대치를 변동시키면서 보여준다.

(게티이미지)

◇이세돌 9단 은퇴 대국 AI '한돌'은?

이세돌 9단의 은퇴 대국 상대인 바둑 AI '한돌'은 NHN에서 만든 프로그램이다. 2017년 12월 공개된 '한돌'은 구글 딥마인드가 같은 해 발표한 알파고 제로 및 알파제로 논문들에 담긴 머신러닝 기법들이 적용됐다.

'한돌'은 지난해 12월 '한돌 2.0' 버전으로 성능을 끌어올렸다. 국내 바둑계 톱기사들과의 대국 경험과 꾸준히 한게임을 통해 일반인과 상시 대국하며, 수많은 대국 경험으로 노하우를 축적했다.

이세돌 9단이 대국한 3년 전의 '알파고 리' 수준은 넘어섰다는 평가를 받고 있다.

한돌은 지난해 12월 28일부터 올 1월 23일까지 한국 기사 5명과 각각 단판 승부를 겨루는 '프로 TOP5 vs 한돌 빅매치'라는 이벤트 대전을 가졌다. 당시 한돌은 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단, 신진서 9단을 상대로 모두 승리했다.

올 7월에는 성능 업그레이드를 통해 '한돌 3.0' 버전을 공개했고, 8월 개최된 중신증권배 AI바둑대회에 참가해 존재감을 드러냈다. 한돌은 총 14개 팀이 참여한 가운데 예선전에서 5위를 차지하며 8강에 올랐고, 벨기에 '릴라제로(Leela Zero)', 대만 '씨쥐아이 고(CGI GO)', 일본 '글로비스 에이큐제트(Globis-AQZ)' 등을 상대로 승리하며 국내 AI 기술력을 세계에 선보였다.

대회 우승과 준우승은 중국의 '절예', '골락시(GOLAXY')가 각각 차지했다.

개발 초기 한돌은 '한게임 바둑' 데이터 등 사람이 둔 기보를 학습해서 다음 수를 예측하는 정책망(바둑 AI에서 다음 후보 수를 결정하는 딥러닝 모델)을 사용했고, 출시 시점에는 사람이 둔 기보로 학습한 정책망으로 후보 수를 선택한 후 자가 대국을 한 기보로 학습한 가치망(바둑 AI에서 현재 수순에서 승리 확률을 구하는 딥러닝 모델)과 패턴(한돌 개발에 사용된 바둑돌들의 특정 모양)으로 끝까지 빠르게 둔 롤아웃(한돌 1.0에서 쓰였던 알고리듬으로, 바둑판에서 좁은 영역에 돌이 4개나 9개 정도 놓일 수 있는 곳에 특정 패턴의 돌이 놓이면 미리 만들어둔 패턴으로 돌을 두는 것)으로 다음 수에 대한 승리 확률을 얻었다.

이렇게 선택하고 얻은 수에 대한 승리 확률에 MCTS(바둑이나 장기처럼 상대방과 내가 번갈아 가면서 두는 게임에서 내 턴에 내가 제일 좋은 수, 상대 턴에 상대가 제일 좋은 수를 번갈아 가면서 시뮬레이션해 좋은 수를 찾는 방법)라는 수읽기 알고리듬을 사용해 다음 수를 예측했다.

이런 과정을 거쳐 현재 '한돌'은 꾸준한 성능 개선을 거쳐 2016년 이세돌 9단과 대국한 알파고 리, 2017년 커제와 대국한 알파고 마스터 수준을 넘어서는 기력을 갖췄다.

현재 '한돌'은 △한게임 바둑 대국실에 상주하며 한게임 9단과 대국 진행하는 '한돌 9단 대국' △대국 중 '한돌'이 알려주는 강력한 다음 수 힌트 서비스인 '한돌 찬스' △종료된 대국에 대해 승부에 결정적인 영향을 미친 패착·승착을 확인하고 승부 흐름 파악을 도와주는 '한돌 승률 그래프' 등 바둑 이용자들을 위해 다양한 서비스를 지원하고 있다.