타이젬 관전기
뉴스IN 뉴스人
나는 유저다
적중! 오늘의 빅매치
타이젬 시사저널

속보뉴스
인터뷰

속보뉴스
인터뷰

포토뉴스
동호회
인터뷰
타이젬 9단들의 향연

동양증권배 관전기
동양생명배 관전기
김성룡의 따따부따

더보기
2017년 7월
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
 
 
 
Home > 뉴스 > Weekly 타이젬 > 타이젬 시사저널

타이젬 시사저널
이세돌, 알파고에 완승 거둘 것!
이세돌vs알파고 대결, AI전문가 김찬우에게 듣는다.
2016-03-04 오후 11:16:54 입력 / 2016-03-09 오후 1:43:52 수정
▲ AIS소프트웨어 대표인 인공지능바둑전문가 김찬우 프로

구글 딥마인드는 지난달 22일 기자회견을 열고 이세돌과 알파고(AlphaGo)의 '구글 딥마인드 챌린지 매치' 세부계획을 발표했다. 기자회견 전후로 인간대표 이세돌과 컴퓨터 최강프로그램 알파고의 대결이 연일 톱뉴스에 오르는 등 바둑이 전례 이 언론의 주목을 받고 있다.

'알파고(AlphaGo)'의 당돌함에 일단 세계가 놀랐다. 구글이 2014년 인수한 딥마인드는 인공지능(AI-Artificial Intelligence) 기업으로, 지난 1월 세계적 권위의 과학잡지 네이처(Nature)에 게재된 논문을 통해 프로기사에게 최초로 승리한 프로그램으로 알파고를 소개하고 있다.

알파고는 또한 현재 가장 강한 바둑소프트웨어 '크레이지스톤(Crazystone)'과 '젠(Zen)' 등과 총 495회 대국에서 딱 한번을 패했을 뿐이다. 또한 중국계 유럽챔피언 판후이와 다섯 차례 대국에서 모두 승리했을 정도로 만만찮은 기력을 자랑한다. (기보감상에서 'ALPHAGO' 또는 '판후이'로 검색하면 알파고vs판후이 대국을 감상할 수 있다.)

알파고가 절대자 이세돌과 100만달러를 걸고 겨루어보자고 도전장을 던진 것 자체가 놀라운 일이다. 물론 컴퓨터가 바둑을 정복하기는 시기상조며, 향후 발전 속도를 짐작해볼 수 있는 것만 해도 소득일 것이라고 바둑가는 전망하고 있다. 그러나 일각에서는 알파고가 당장 대등하게 싸울 수 있을 것이라는 엇갈린 '위험한' 전망도 내놓고 있다.

아쉬운 것은 쏟아지는 뉴스마다 '한쪽만' 전문가의 소견을 들어본 케이스라는 것이다. 이에 타이젬에서는 바둑과 컴퓨터 양쪽에 해박한 지식을 지닌 김찬우 프로를 만나 이세돌-알파고 대결에 대한 여러 궁금증을 들어보았다. 김찬우는 오래전부터 타이젬에 인공지능 '은별'을 제공하고 있으며, 바둑교육 및 대국 앱 '바둑의 제왕'을 출시한 AIB소프트웨어 대표이기도 하다.

▲ 이세돌이 구글 딥마인드의 CEO 데미스하사비스와 화상으로 하이파이브를 하고 있다.

이세돌vs알파고 대결에 관심이 폭발적이다. 유저들의 이해를 돕기 위해서 결론부터 물어본다. 이번 대결을 어떤 관점에서 봐야 하나?
알파고가 어떻게 만들어졌는지 이해하는 것이 중요하다. 컴퓨터가 두려는 후보수를 선택하는데 있어서, 과거엔 '정책망'이 제대로 갖춰지지 않았기 때문에 이상한 수들이 많이 나왔다. 그러나 알파고는 유럽바둑사이트 KGS 6단~9단 기보 16만 판을 초기 데이터로 삼아 하나의 패턴을 만들었기 때문에 사람이 두는 웬만한 행마는 구사한다.
그 수들이 3000만수 정도 된다고 하는데, 6단~9단 사이니까 불순물이 다소 섞여있을 수 있다. 그래서 한 수 한 수 정책망에서 뽑아주는데 그 연산양이 또 엄청나다. 문제는 6~9단 기보에서도 좋은 수가 발견되었지만 예외처리가 되어서 빠져나가는 경우가 생기다는 것이 흠이다.
알파고는 어떤 벌어질 상황을 예측하며 사전수읽기를 할 수 있는 능력은 없지만, 대신 균형감각은 굉장히 좋다. 이길 확률이 많은 수를 찾고, 예측하지 못했던 낯선 수에 대해선 피해를 최소화하며 타협을 한다. 결국엔 이세돌이 의표를 찌를 때 알파고가 얼마나 타협을 잘 하느냐가 포인트다.

※ 정책망(policy network)과 가치망(value network)
알파고가 바둑돌을 놓을 위치를 정하는 알고리즘은 '정책망(policy network)'과 '가치망(value network)'의 두 신경망의 결합에 의해 이루어진다. 바둑에서 둘 수 있는 경우의 수를 무한대로 가정했을 때, 알파고는 '정책망'과 '가치망'이라는 두 개의 신경계를 활용해서 가능한 모든 경우의 수를 줄여나가는 작업을 한다. 첫째 신경계인 '정책망'을 사용해서 어떻게 두는 것이 승리 가능성이 높은지 제안하게 된다. 이 때 탐색 트리가 무한대로 펼쳐지는 것이 아니라 가능성이 높은 수들로 추려지게 된다. 둘째 신경계인 '가치망'에선 그 수가 흑과 백에 얼마만큼 좋은 수가 되는 지를 얘기해주게 된다.

▲ 세계적 권위의 과학 잡지 '네이처'에 소개된 알파고와 구글 딥마인드의 CEO 데미스하사비스.

체스와 달리 바둑에 대한 컴퓨터의 도전이 거의 전무했다. 자칫 컴퓨터의 무모한 도전은 아닐까.
그렇진 않을 것이다. 딥블루 개발팀이 무에서 유를 만든 게 아니다. 기존의 '몬테카를로 기법'을 응용했고, 신경망을 통해 이미지를 인식했고, 이미 연구해오던 지문인식 홍채인식 등 상용화된 기술을 이용했다. 다만 바둑에다 그 기술을 접목시키는 시도를 처음 했다는 것 뿐이다.

유럽챔피언 판후이와의 기보를 분석했을 때 알파고는 어떤 스타일인가.
몬테카를로 트리탐색(MonteCarlo TreeSearch)을 하게 되면 대체적으로 중앙을 중시한다. 선실리 후수습의 형태는 잘 두지 않고, 두텁게 두어놓고 전투에서 힘을 내는 것이 엔진들의 특징이다. 두텁게 두어놓고 공격하는 것이 쉬운 수법이긴 하지만 집 부족일 공산이 크다. 타입으로 보면 전성시절 이창호와 비슷하지만, 좀 더 정확하게는 두텁게 해서 한방을 터트리는 타입의 원성진에 가깝다. 예를 들어 지금 이 대마를 잡지 않으면 곤란하다는 판단이 서면 수읽기가 엄청 세다.

다른 엔진과 달리 알파고만의 특징은 무엇인가
기보를 가지고 사람들이 두는 유력한 수들을 추려냈다는 데 있다. 탐색을 하고 뽑아주고 하는 방법으로 몬테카를로 트리서치를 효율적으로 관리했다. 거기에 과연 유력한 후보수가 다 들어갈 수 있을지는 의문이다.

이번에 알파고가 다른 엔진들을 4점까지 접고 이겼다고 하던데, 생각보다는 센 것 아닌가.
내가 처음 은별을 테스트할 때도 9점 바둑으로 은별이 나에게 질 뻔했다. 은별은 타이젬에서 테스트할 때 초단에서 시작해서 3단까지 간 실력이다. 그런데 이후 17점까지 내가 접었다. 엔진들은 4점을 까는 순간 기력도 4점 하수처럼 쭉 떨어지는 모습을 보인다.

처음 판후이와 대결할 때가 작년 10월이었고, 이세돌과 대결까지 5개월의 시간이 있었다. 세간에는 알파고가 무섭게 업그레이드가 될 것이라는 주장도 있다.
타이젬에서 둔 기보를 보면 그렇게 발전하지 않았다. 190수에서 흑이 이길 확률이 좀 놓아졌다면, 백이 잘못 둔 수를 찾을 수는 있다. 그럼 그 다음부터는 이 수를 안 쓰기 때문에, 그것이 자기 실력을 강화시킨다는 주장이다.
스스로 문제가 없다고 생각하는 구간에서 진짜 문제가 없는 것인지 따져볼 필요가 있다. 만약 그 부분에서 고칠 게 많다고 하면 이세돌이 봤을 때 알파고에 이상한 수가 많이 있을 확률이 높다는 것이다. 타이젬에서 알파고는 2014년부터 'deepmind'라는 대화명으로 5단 시절부터 두어왔다. 알파고가 최근 2월 한 달 동안 타이젬에서 두는 걸 보면 거의 발전하지 않았다.

▲ K바둑에서 알파고-판후이 기보를 분석하고 있는 김찬우 프로(오른쪽).

판후이-알파고 대국을 보면서 느낌 소감은?
첫판은 판후이가 좋았는데 너무 안정하게 두다가 완착을 많이 범해 역전패를 당했다. 1국은 알파고가 속기로 두었는데, 그 다음엔 알파고가 장고를 하는 것으로 보았다. 첫판 내용이 맘에 안 들었던 모양인지 구글에서 세팅을 바꾼 것이다. 2국부터는 판후이가 의도적으로 싸움바둑을 해봤는데, 알파고가 굉장히 수읽기가 세졌다.

그래도 0-5로 완패를 당한 것은 실력이 아닌가. 판후이의 냉정한 실력을 평가한다면?
판후이는 중국계로 중국에서 입단대회를 통과했다. 절대 타이젬9단 실력은 충분하다.

그렇다면 알파고의 실력은?
알파고도 타이젬 9단 실력은 충분히 된다. 타이젬에서는 5단에서부터 500판정도 두어서 9단까지 올라왔다. 개발자인 아자황(Ajahuang)이 유럽에서는 6단 정도 되는 강자다. 따라서 타이젬 7단 강, 8단 약 정도까지는 그가 둔 것이라고 해도, 8단부터 9단까지는 알파고의 솜씨였을 것이다.

이세돌이 한판도 못이길 것이라는 전문가도 있다. 반론을 제기 한다면?
나도 그 기사는 봤다. 그러나 두 가지 가정이 잘못된 게 아닌가 한다. 하나는 알파고가 6단~9단의 기보를 모아서 9단을 이겼으니, 약한 사람들의 수로서 센 사람을 이겼다는 주장이다. 그러나 6~9단이라면 대부분은 프로처럼 둘 수 있지만, 가끔 '질 낮은' 수들 때문에 패하고 마는 것이다. 그런데 이 뚝 떨어지는 한 수는 프로그램에서는 걸러내면 된다.
알파고는 10만수정도를 탐색한다고 했는데, 몬테카를로 트리탐색에서 10만수는 엄청나게 적은 표본이다. 그런데 무작위 10만수가 아니라 불순물을 걸러낸 10만수는 오히려 무차별 표본 몇 억수보다 효율이 더 좋을 수 있다. 즉, 알파고에 장착된 기본 데이터는 '약한 사람'이 아니라는 것이다.
또 하나는 컴퓨터가 강화학습을 하니까 스스로 는다는 가설이다. 아마 기보를 이해하는 분이라면 알파고가 그다지 세지지 않았다는 것을 알 것이다. 정책망에 오를 후보를 뽑을 때 후보로 안 올라오니까 컴퓨터는 한계가 있었던 게 아닌가 한다.



이세돌이 오히려 실수를 하게 되면 알파고는 받아칠 수 있겠는가?
응수타진을 했을 때 모조건 받아주진 않는다. 의표를 찔러간다는 것은 자신의 약한 돌이 있다는 것인데, 알파고는 약한 돌을 잘 안 만든다고 하질 않았는가. 모든 데이터를 통해서 엷다고 판단이 되면 결국은 두텁게 둘 것이다. 알파고가 자기 자신은 최선을 다한다고 해도 야금야금 손해를 볼 가능성이 크다.
나는 다른 엔진 '젠'과 5초 바둑으로 둔 적이 있다. 젠은 처음에는 4점에 버텼지만 역시 몬테카를로 트리서치의 약점이 드러나며 그 이후엔 8점도 접었다. 결정적인 약점이 알파고에도 있다.

결정적인 약점이 무엇인가?
우리가 인공지능과 인간의 대결이라고 하지만, 알파고엔 사람이 하는 수읽기는 없다. 사람은 최선을 수를 찾지만 알파고는 이길 확률이 높은 수를 둔다. 다만 바둑이 유리한 상황에서는 최선의 수를 찾기보다는 안전하게 두다보니 완착이 많다.
그럼 가장 강력한 힘을 발휘할 때는 형세의 균형이 잡혀있을 때인데, 이길 확률이 높은 수가 최선의 수일 가능성도 높다. 그렇기 때문에 팽팽하거나 전투가 일어나거나 확실한 목적이 생겼을 땐 최선의 수를 잘 찾는다. 반대로 유리한 상황에서 서치를 하면 컴퓨터가 '이 수도 좋고, 저 수도 좋고' 할 것 아닌가. 차선의 선택은 일류들에게는 소위 '떡수'다.

점점 흥미로워진다. 이번 대결이 제한시간 2시간인데, 이것은 누구에게 유리한가?
알파고-판후이 대결에서는 1시간에 30초 3회였고, 비공식 대국으로서 30초 3회의 속기였을 때는 판후이가 2승3패를 했다. 만약 속기로 두자고 했으면 구글에서 거기에 맞춰서 서치를 시키면 된다. 그러나 무한정 코어를 늘릴 수는 없다. 신경망은 잘 짜진 프레임이니까.
트리서치를 하는 CPU는 조금 손볼 수는 있다. 가령 1분 안에 찾을 것을 30초에 찾게 한다든지 할 순 있다. 그러나 속기나 장고나 별 차이가 없다는 것이다. 다만, 이세돌은 자신의 최선을 다할 수 있는 시간이 2시간이라고 판단한 것이다.

서버문제가 변수가 될 가능성은 없는가?
구글에서 클라우드서버를 엄청나게 구축할 것이다. 아무래도 용량이 크면 서치 하는데 도움이 된다. 99% 처리하는데 서버 1천대를 쓴다면 99,9%를 처리하려면 1만대를 써야 한다. 과연 그렇게 해서 퀄리티가 얼마나 올라가겠는가.
컴퓨터가 바둑을 둔다는 것은 유력수를 뽑는 과정이니까 후보수는 적은 게 좋다. 단, 유력한 후보가 빠지면 안 된다. 이게 딜레마요 이율배반적이다. 제일 좋은 것은 유력수를 하나만 뽑는 수직탐색인데, 바둑에서는 비슷한 자리들이 여러 개 있으니까 수직탐색은 불가능에 가깝다.

최적의 수를 찾기 위해서는 알파고가 어떤 점을 보강해야 하나?
유력수를 추출할 때 국면을 인식하게 해야 한다. 국면을 정확하게 인식을 하고 자기가 해야 할 일의 목적을 전하고, 그 변화가 일어났을 때 단순하게 이길 확률이 아니라 '이게 이득이다 손해다'라는 방식을 써야 가능하다. 어쩌면 그것이 진짜 인공지능이다.
▲ 지난달 열린 기자회견장에서 100여명의 내외신 기자들과 마주한 이세돌.


종합해보면, 이번 대결에서 이세돌은 초반에 격차를 벌려놔야 할 것 같다.
옛날 포석을 쓰는 알파고는 초반에 야금야금 실수를 할 것이다. 정상급들에게 그런 바둑을 두어서 이겨간다는 것은 힘들다. 어차피 중반으로 넘어가면서 이중허리 삼중허리가 되기 때문에 균형을 맞추려고 할 것이다. 중반전에서 이길 확률이 높은 쪽으로 생각을 하다보면 알파고가 무리할 것이고, 후반에 가면 역시 무너지는 패턴이 될 것이다.

엇비슷하게 중반을 넘었다면, 컴퓨터는 끝내기가 강할 것이라는 생각인데…
다시 말하지만 그냥 이길 확률만 쫓아가는 것이어서 컴퓨터의 끝내기는 전혀 완벽하지 않다. 끝내기를 과정에서도 찜찜한 곳이면 그냥 지키는 경우도 많고, 바둑이 좋으면 안전위주로 두기 때문에 계속 격차가 오히려 좁혀진다. 20집 이겨있는 바둑을 반 집 승부를 만들어준 케이스가 있을 정도다. 사람이 둔다면 전혀 그렇지 않다.

스스로 판단하여 불계선언도 할 수 있나?
엄밀히 말하면 완전한 인공지능이 아니기 때문에 스스로 판단할 수 있는 능력은 없다. 다만 세팅을 그렇게 하면 가능하다. 예를 들어 지금 시점에서 이길 확률이 5%도 안 될 때는 불계선언을 하도록 만들면 자체적으로 불계선언을 할 수 있다.

알파고가 기풍을 변경할 수도 있나?
처음부터 데이터를 다르게 넣어주어야 한다. 정책망 구조자체가 달라야 한다. 몬테카를로에서는 중앙 중심적으로 두터운 바둑이 된다. 단, 확정가에 가중치를 주고 발전성 가중치를 적게 주면 실리파가 된다. 거꾸로 발전성에 가중치를 더 주면 싸움바둑 되고. 그러나 몬테카를로라는 것이 확률인데, 인위적으로 낮은 확률을 찾아가라는 얘기 밖에 안 되는 것이다.

자, 결론적으로 승패 예상은?
알파고는 균형을 유지 하는데 특출 나고, 상대가 실수를 하게 되면 이겨가는 길을 찾는 것도 뛰어나다. 이세돌이 초반에 차이를 못 벌리고 중반으로 넘어온다면, 인간특유의 감정이 들어가게 될 것이고, 그때는 알파고는 강하게 응징하러 나설 것이다. 그러나 이세돌이 방심하지 않는다면 5-0으로 완승을 거둘 것이다.

호선바둑끼리 정선으로 둔다고 해도 5-0 스코어는 나기 힘든데, 알파고를 무시하는 것 아닌가(웃음)?
프로기사가 되기 위한 노력과 일류 프로가 되기 위한 노력 중 어느 노력의 더 크게 작용할지 생각해보면 쉽다. 이제 컴퓨터는 프로에 입단할 정도가 된 것이다. 99% 따라 왔다고 금방 100%에 다다를 것이라고 보지만, 그 1%는 쉽게 채워지지 않을 것이다.

이세돌을 이기기 위해 이세돌 기보를 입력하면 이길 수 있나?
바둑에서 나오는 일반적인 것을 다 들어가야 하는데 이세돌 기보로는 기본 데이터가 너무 적다. 지금도 알파고도 10만판 이상이 들어갔다.

애초에 타이젬 9단 대국에서 데이터를 추출했다면 달라지지 않았을까?
타이젬 9단 기보로 16만 판이라면 조금은 달라지겠지만, 어차피 몬테카를로 기법에서는 큰 의미는 없을 거다. 기보가 더 들어간다고 해도 정책망을 바꿀만한 퀄리티가 올라가는 게 아니고, 접근방식이 다르기 때문에 근본적 해결은 힘들다. 어차피 확률이기 때문에 주사위를 1만 번 던지면 거의 6분의 1에 수렴하지만, 그 회수를 100만 번, 1억 번 던진다고 해도 거의 차이가 없는 것과 같은 이치다.

▲ 한국과 영국에서 화상 기자회견을 하는 모습.


사람이 두는 것인지 알파고가 두는 것인지 구별이 되는가
구별된다. 지금까지 말한 컴퓨터의 패턴을 적용해서 보면, 급소를 찔러왔을 때 반발하지 않고 순순히 양보한다든지, 중앙을 중시하는 행마를 한다든지, 수가 안 나는 곳임에도 불구하고 두텁게 보강하는 경우를 자주 보게 될 것이다.

알파고가 중국룰에 기초하여 제작된 이유가 있는지?
최소한의 착수금지 규정만 제외하고, 수를 메우는 식이 컴퓨터가 이해하기 쉽기 때문이다. 알파고는 유효착점을 다 한 뒤에도 몇 수 정도는 계속 자기 집을 메우곤 한다.

오늘 대화를 정리하면, 인간과 컴퓨터의 대결이 아니라 인간과 인간의 대결인 것 같다.
인간과 컴퓨터의 대결은 아니다. 홀로 싸우는 인간과 인간의 대결이다. 정상급 기사들은 한데 모여서 상담기를 두게 하고, 컴퓨터는 고급 클라우드에 1만대 쯤 붙어야 인간과 컴퓨터의 대결이 되지 않을까(웃음)?

이번 대결을 앞두고 이세돌에게 조언을 하거나 이세돌이 조언을 요청한 적이 있는가
직접 이세돌과 접촉하지는 않았지만 간접적으로 정보를 주기는 했다.

김찬우 프로는 국내에서 독보적인 인공지능바둑 전문가인데 언제부터 관심을 가졌나?
나는 바둑보급을 해야 하는 프로다. 바둑을 쉽게 둘 수 있게 해야 한다는 생각에서 여러 방면을 찾아다니다 보니 인공지능까지 왔다. 그런데 알고 보니 인공지능 쪽이 부실하여 이 참에 새로 만들어야겠다고 생각했다. 그러다 보니 점점 프로그램에 대한 이해도가 높아지고 아예 설계까지 해주게 되었다.

인간과 컴퓨터의 대결에서 인간이 지게 되면 바둑의 경외심이나 신비로움이 퇴색할 것이라는 주장에 대해선?
이번 대결이 끝나고, 만일 구글이 도전을 포기한다면 굉장히 슬퍼질 것이다. 오히려 이세돌과의 승부가 해볼만하다고 해야 불모지 유럽에 바둑보급을 하는 데 도움이 될 것이다. 체스는 컴퓨터가 점령했다고 해서 체스인기가 시들해졌다는 것은 언어도단이며, 오히려 체스의 인공지능시장이 수 만 개나 될 정도로 활황이다. 굴지의 해외 기업이 바둑으로 세계적인 이벤트를 하겠다는데 한국으로서는 정말 고마운 일이다. 세계적으로 바둑이 이처럼 스포트라이트를 받은 적이 없다. 구글의 바둑을 향한 도전은 계속되어야 한다.

▲ 타이젬과 동아사이언스가 동시에 김찬우 프로를 인터뷰하고 있다.
TYGEM / 진재호 바둑평론가
트위터 페이스북 다음글이 없습니다.

관련기사
타이젬 시사저널 2015 바둑대상 MVP는 누구?[22] 2015-12-23
타이젬 시사저널 10대뉴스 1위…커제, 세계2관왕[9] 2015-12-17
타이젬 시사저널 라이벌 구도로 본 韓中 영웅들[10] 2015-01-28
타이젬 시사저널 10대뉴스 1위 '이세돌 10번기 승리'[8] 2014-12-30
HomeTop

 

뉴스 Best
페어바둑 아이콘은 김미리?
영암월출산, 2-1로 개막..
불뿜는 랭킹 1, 2위 자..
정관장 김명훈, KB리그 ..
포스코켐텍, 티브로드 대파..
중국 'ddcg', 인터넷..
신안천일염 주장 부재, 이..
서울대, 대학동문전 첫 우..
강동윤-김은선 4강행 막차..
이세돌 없는 신안천일염, ..

회사소개 | 광고소개 | 제휴소개 | 인재채용 | 이용약관 | 개인정보 취급방침 | 청소년 보호정책 
동양온라인(주) 대표이사:박형신 사업자등록번호:211-86-95324  사업자정보확인
서울시 강남구 학동로 206 동화빌딩 3층
제호: 타이젬 등록번호: 서울 아04168 등록일자: 2016.10.4
발행인: 박형신 편집인: 정연주 청소년보호책임자: 장성계
전화 : 1661-9699 (상담시간:10:00-18:00)   FAX : 070-7159-2001   email
Copyright (c) 동양온라인(주) All Rights Reserved.