PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2016/03/09 16:53:37
Name 꼭두서니색
Subject [일반] 알파고의 대국 메커니즘

[AlphaGo - The first computer program to ever beat a professional player at Go]

AlphaGo?
알파고는 구글 딥마인드에서 개발한 바둑 인공지능입니다. 이미 유럽챔피언인 판 후이 2단을 5:0으로 꺾어 화제가 되었는데요, 과거 체스 등 인간의 영역으로 여겨졌던 분야에서 인간을 꺾은 인공지능이 종종 있었으나, 바둑은 그 수의 경우가 워낙 많아 인공지능은 사람을 절대 못 이길 것이다..하는 생각을 뒤집어 버린 획기적인 사건이었죠.

사실 구글 딥마인드에서 인간에 필적하는 인공지능을 테스트하는 것은 이번이 처음은 아닙니다. 작년 초 네이처지에 "Human-level control through deep reinforcement learning"이라는 논문을 발표하면서 자체 개발한 Deep Q-Network(이하 DQN)을 아타리 게임에 적용하여 49개의 게임 중 29개의 게임에서 인간 전문가의 75% 이상에 해당하는 점수를 획득했다고 알린 바 있습니다.

왜 바둑인가?
19x19의 반상에서 펼쳐지는 바둑은 체스나 장기 등과 달리 돌이 놓이는 위치와 이후의 수에 대한 가치를 평가하는 것이 매우 어려운데다 경우의 수도 엄청나게 많기 때문에 인공지능 분야에서는 매력적인 도전으로 여겨지고 있었습니다. 체스에서는 이미 IBM의 딥 블루가 당시 세계 챔피언 그랜드마스터였던 가리 카스파로프를 압살한 바 있으나 바둑의 경우 잘해봐야 아마추어 수준을 넘어서지 못하고 있었죠.


[유럽 챔피언 판 후이 2단과 알파고의 대결]
여기에 알파고가 도전장을 던졌고, 결과는 유럽 챔피언을 상대로 5:0이라는 완승을 거둡니다. 이에 전 세계의 인공지능 연구자들과 바둑 애호가들의 이목이 쏠렸고, 이세돌 9단과의 대국까지 성사되는 등 난공불락의 철옹성으로 여겨지던 바둑에서까지 인간을 넘어서려는 도전을 하고 있습니다.

기본 동작 원리
바둑은 수가 너무 많기 때문에 brute force 방식의 '일단 다 따져보자!'는 사실상 불가능합니다. 그렇다고 임의로 찍자니 이게 제대로 된 수인지 객관적으로 판별할 방법이 없죠. 알파고는 이 문제를 해결하기 위해 1) 경우의 수를 줄이면서 2) 결과를 더 빨리 예측하는데에 집중합니다.

1) 경우의 수 줄이기(Breadth Reduction)

위와 같은 수가 놓였다고 할 때, brute force 방식으로는 다음에 놓일 수 있는 모든 수를 다 따져봐야 합니다. 이건 가장 확실하지만 동시에 가장 비효율적이기도 하죠. 알파고는 경우의 수를 줄이기 위해 학습한 기보를 기반으로 상대가 이 다음에 놓지 않을 수를 제거합니다. 기보를 학습해보니 이 다음엔 여기에 놓는 경우가 없더라..하는 식으로요.


이렇게 하면 경우의 수를 획기적으로 줄일 수 있습니다. 제가 바알못이라 바둑을 정확하게 알지는 못 하지만, 사람간의 모든 턴제 대전이 그렇듯 '말도 안 되는 수'와 '합리적인 수'는 구분되기 마련이고 알파고는 여기에 착안하여 이 다음에 올 수 없는 수를 제거하여 가능한 경우의 수를 줄입니다.

2) 결과 더 빨리 예측하기(Depth Reduction)
경우의 수를 줄인 건 좋은데, 여기에도 맹점은 있습니다. 이후에 이어질 수를 예측하고 이게 대국의 끝까지 진행되었을 때 내가 이기냐 지냐를 판별해야 하는데, 한 수 둘 때마다 이러면 brute force에 비해 줄었다고는 하나 여전히 시간이 엄청 오래 걸리게 됩니다. 알파고는 이를 해결하기 위해 depth reduction이라는 프로세스를 수행하는데, 이는 대국이 진행되면서 내가 다음에 두는 수의 가치는 어느 정도인가?를 수치로 나타내어 대국의 끝까지 예측하지 않고 이 정도면 됐어!하는 지점에서 멈춰 예측을 보다 빨리 하는 과정입니다.


위 그림에서 d를 대국의 진행 정도, 각각의 예측을 s, V를 수의 가치라고 하면, V(s)를 s라는 수를 두었을 때의 유/불리로 볼 수 있습니다. 이를 통해 대국의 끝까지 예측하지 않아도 현재 대국의 판세를 판단하고 다음에 둘 수를 보다 빨리 결정할 수 있게 됩니다.

학습은 어떻게 했는가?
4주간 3천만개의 착점으로 구성된 16만개의 고수들의 기보를 학습하고 이를 기반으로 자가 대국 100만 판을 해서, 인간이 하루에 3번의 대국을 한다고 쳤을 때 약 1천년치에 해당하는 훈련을 거쳤다고 합니다. 이 과정을 좀더 자세하게 풀면..

1) Supervised Learning
'16만개의 기보'를 학습하는 과정은, 현재의 수 및 반상의 판세를 바탕으로 '지금은 이랬는데 다음엔 저렇게 두는게 많더라'하는 식으로 이루어집니다. 다시 말해, 프로 기사 등 전문가들의 기보를 학습하면서 각 수와 수 사이에 예측 모델을 두고 이 예측 모델에 다음에 행해지는 수를 다 입력하는 방식입니다.

예를 들어, 아래와 같이 대국이 진행되는 기보가 있을 때..


이 기보에서는 이 사람이 이렇게 두었더라..라고 학습합니다. 이런 학습 결과를 모으고 모아서,


L:p(next action | current state)로 표현할 때, 이런 식으로 다음 착점의 가치를 계산하고 가장 승률이 좋았던 곳은 여기구나! 하는 식으로 학습합니다. 이런 식으로 판세를 읽는 데에는 입력값을 레이어별로 추상화하여 출력값을 뽑아내는데 매우 유용한 Convolutional Neural Network(CNN)이라는 기법이 사용됐습니다. 그냥 그런게 쓰였구나..하고 넘어가셔도 됩니다..^^;

2) Reinforcement Learning
알파고의 학습에서 핵심이 되는 파트입니다. 쉽게 말해, 입력된 기보를 바탕으로 자가 대국을 수행하여 상황에 따른 다음 수별 승률을 계산하고 최적의 수를 찾는 학습 과정입니다.



예를 들어, 같은 상황에서 예측 모델을 거쳐 다음 수를 이렇게 두니까 졌는데 저렇게 두니까 이기더라.. 하는 식으로 자가 대국을 거쳐 수의 가치를 보정하고 이를 통해 반복적으로 자가 업데이트를 수행하여 끊임없이 발전해나갑니다. 알파고 논문에서는 학습 완료 후 모델과 최초의 모델을 대국시켜봤을 때 학습이 완료된 모델이 80% 승률을 기록했다고 합니다.

요약 정리
이상을 요약하면, 알파고는


전문가의 기보를 바탕으로 학습을 하고 자가 대국을 통해 발전하며, 실전 대국시에는 1) 경우의 수를 줄이고(Breadth Reduction) 2) 판세를 판단하고 결과를 더 빨리 예측(Depth Reduction)하는 인공지능입니다. 대국 메커니즘을 정리하면 아래와 같으며, 이런 방식을 몬테 카를로 탐색 트리 기법이라고 합니다.


a. Selection
이게 괜찮은 수인지, 되도 않는 수인지를 판단하여 경우의 수를 줄입니다.(Policy Network)
b. Expansion, c. Evaluation
보다 빠른 예측을 거쳐 판세를 판단하고 수의 가치를 평가합니다.(Rollout, Value Network) 논문에서는 이 과정을 거쳐 2us안에 다음 수를 결정할 수 있다고 설명하고 있습니다.
d. Backup
b와 c과정의 결과값을 합쳐 최종적으로 수를 예측하고 결정합니다.

현재 수준은?

a 그래프는 ELO rating 방식으로 측정한 각각 다른 알파고간의 비교입니다. 각 버전은 한 번 수를 두는데에 약 5초정도가 걸린다고 합니다. 3번째가 판 후이 2단인데, 맨 왼쪽의 AlphaGo distributed(single machine이 아니긴 하지만)보다 낮은 걸 보실 수 있습니다. 지금 대국하고 있는 이세돌 9단과는 승부가 어찌 될지 모르겠으나, 만약 이세돌 9단이 진다면......어후..-_-;;
b 그래프는 몬테 카를로 서치 트리의 각 요소를 다양하게 조합해서 대국했을 때의 ELO 지표입니다. 당연하게도 다 쓰는게 가장 좋게 나옵니다.
c 그래프는 GPU와 연산에 사용하는 스레드의 갯수에 따른 ELO 지표입니다. 저 그래프대로라면 아무리 하드웨어를 늘린다고 해도 수렴하는 지점이 나올 것으로 예상되는데, 어디로 수렴할지는 의견이 갈리는 상황입니다. 구글 딥마인드에서는 더 이상의 CPU나 GPU 추가는 없다고 공언한만큼 결과는 아무도 모르겠지만요.

이외에, 자가 대국 수와 향상되는 실력간의 상관 관계 역시 의문점으로 남아 있습니다. 현재 네이처지에 발표된 알파고 논문에는 해당 내용이 공개되어 있지 않아 어떤 상관 관계가 있을지 개인적으로 궁금한 점입니다.


글쓰면서 일하기 싫어서 대국을 계속 보고 있었는데 이세돌 9단이 결국 패배했네요. 이후의 대국도 지켜봐야겠지만, 구글의 최종목표가 세계 정복이라고 농담삼아 그러는데 진짜일지도 모르겠다는 생각이 듭니다. 다음은 스타1이라는데, 어찌될지 기대도 되구요.

긴 글 읽어주셔서 감사합니다. 최대한 쉽게 풀어썼으나 역시 난해해 보이는데, 틀렸거나 궁금한 점은 말씀해주시면 답변드리겠습니다.

※ 네이처지에 실린 논문 "Mastering the game of Go with deep neural networks and tree search"과 ( http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html ) Shane Moon님의 슬라이드 ( http://www.slideshare.net/ShaneSeungwhanMoon/ss-59226902 ) 를 참조했습니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
16/03/09 16:57
수정 아이콘
그나마 희망이라면 아웃라이너 묘수를 프로기사가 더 먼저 발견하고

실수를 하지 않는 것? 일까요
릴리스
16/03/09 16:58
수정 아이콘
재미있게 읽었습니다. 이세돌 9단이 5판 다 질까봐 걱정되네요. 이 정도 차이면 이세돌 9단보다 압도적으로 잘하는게.아닌가 불안감이 있어서요. 차이가 심하다면 커제가 온다 한들 알파고에게 질게 뻔하고.. 인공지능의 발전 속도가 상당히 무섭네요.
창조신
16/03/09 17:00
수정 아이콘
내일 경기에서도 하루만에 사람의 1년치를 학습해서 오겠죠?
한달후에는 바둑계가 컴퓨터에게 비빌수도 없겠네요
유애나
16/03/09 17:00
수정 아이콘
그 수많은 판을통해 이길확률이 높은 경우의 수를 찾아둔다. 이거네요.
매 판 창의적인 수를 생각하지 못하면 결국엔 알파고에게 먹히는거구요.
저 신경쓰여요
16/03/09 17:01
수정 아이콘
좋은 글 잘 읽었습니다.
ohmylove
16/03/09 17:01
수정 아이콘
스타1은 일도 아니죠. 일단 동시 10군데 뮤탈 컨트롤이 나오겠죠.
릴리스
16/03/09 17:05
수정 아이콘
동시 200군데 저글링 컨도 가능합니다.
완성형폭풍저그가되자
16/03/09 17:07
수정 아이콘
스타1으로 하려면 프로그래밍이 아니라 로보트를 만들어서 키보드 마우스를 조작하게 해야죠.
사람도 똑같이 생각만으로 컨트롤하면 누구나 프로게이머인데요.
보지않고도 4곳 멀티 일꾼 일시키고 전투화면까지 조종하는 것을 인정할 수 없는게 당연하다고 생각합니다.
개념테란
16/03/09 19:20
수정 아이콘
생각해보니 이게 맞는거 같네요. 프로그래밍으로 게임이 진행되는건 사람과 인공지능이 스타1 대결을 하는게 아니라, 인간이 최고난도 컴까기에 도전하는 것 뿐이죠.
매벌이와쩝쩝이
16/03/09 17:05
수정 아이콘
와... 몇년 뒤에는 인공지능 기술개발 규제책을 만들자는 논의가 나올 수도 있을 거 같아요...
허니띠
16/03/09 18:02
수정 아이콘
왠지 성지 글이 될 것만 같군요 미리 순례합니다
16/03/09 17:05
수정 아이콘
이세돌 9단이 혹시 이 글을 본다면 한마디 전하고 싶습니다. 한번도 두어보지 않은 수로 경우의 수가 가장 낮은 위치로 시작하는 수를 많이 두어야 1승이라도 할수 있을것 같습니다. 오늘의 7수 같은 수 많이 하셔야 합니다.
공허진
16/03/09 17:05
수정 아이콘
스타1은 뭐하러 하나요.... 마린1마리로 럴커 잡으면서 생산,자원관리,정찰까지 완벽하게 할텐데요
ohmylove
16/03/09 17:06
수정 아이콘
마린 1마리로 럴커를 잡을 수 있나요? 헐
유애나
16/03/09 17:11
수정 아이콘
시야만 있으면 이론적으론 가능하죠.
공허진
16/03/09 17:11
수정 아이콘
예전에 임요환 선수가 피 좀 빠진 럴커를 마린 1마리로 잡은 적이 있는데 연습용 유즈맵이 있다더군요
키스도사
16/03/09 17:47
수정 아이콘
풀피는 힘들꺼 같고(마린이 럴커 촉수 피하려면 스팀팩을 빨아야 하는데 지속시간+공격력으로 럴커 체력을 다 깎을지가...), 피가 별로 없는 경우에서는 대회에서도 한번 나왔죠.

코카콜라배때 임요환 선수가 김신덕 선수의 피가 얼마 안남았던 럴커를 스팀 빤 마린으로 촉수를 3~4번 피해가며 잡은적이 있었던걸로 기억합니다. 레가시 오브 차였던거 같은데 처음 봤을때 엄청난 충격이었죠.
천일야화1
16/03/09 17:59
수정 아이콘
시야만 있으면 체력 만땅 럴커 마린 1마리로 잡을 수 있습니다

럴커 체력이 얼마인지는 안중요하구요

이 컨트롤은 거의 01년 00년에 유즈맵 나오면서 많이들 하셨었는데
시나브로
16/03/09 19:49
수정 아이콘
마린이 럴커 촉수 피하는 거 스팀팩 안 빨아도 되고 심지어 사업 안 해도 컨트롤 하면 한 대도 안 맞고 럴커 잡을 수 있을 겁니다.

사업 마린으로 1:1 럴커 잡는 거 그렇게 난이도 있는 컨트롤 아니고요.

계속 인스네어 맞은 상태인 밀리 유닛 시즈탱크 퉁퉁포로 도망가다 퉁 한 번 쏘고 또 무빙으로 도망가다 퉁 한 번 쏘고 도망가고 그 정도로 안 어려운 난이도라고 봅니다.
16/03/09 17:05
수정 아이콘
이세돌 9단 멘탈나갔을것같은데..누가 이기든 이기면 진짜 대단하다고 밖에 인정할수없는 상황이됐네요.
16/03/09 17:08
수정 아이콘
스타1으로 대결하면 누구랑 붙을까요. 아마도 이영호겠죠?
공허진
16/03/09 17:13
수정 아이콘
대회 당일에 프로토스를 고르는데...
16/03/09 17:24
수정 아이콘
그리고 그 옆에 누가 온풍기를 틀게 되고......
人在江湖
16/03/09 17:42
수정 아이콘
특명을 받은 MBC기자가 전력실에 난입하는데...
하르피온
16/03/09 19:09
수정 아이콘
셧다운제가 오후 6시부터 30세나이로 확대되는데...
세종머앟괴꺼솟
16/03/09 17:10
수정 아이콘
음... 리플 중에 창의적인 수 기존에 보지 못한 수로 두는 게 유리한 면이 있긴 합니다만 거기에 집착하는 건 썩 좋은 방법은 아닙니다. 비슷한 손익의 두 수 중에서 낯선 수를 고르면 최상이지만, 일부 손해 감수하면서 그런 수를 감행한다면 별로 좋은 접근은 아니라고 봅니다. 알파고가 모든 판 형세를 100% 정확하게 판단한다고 볼 수도 없는 거고... 알파고가 대단하긴 한데 또 실체보다 너무 과대평가되는 듯한 느낌도 약간 드네요... 아직까지 난공불락의 완전체까지는 아닐 거 같습니다...
16/03/09 17:10
수정 아이콘
연구실에서 틀어놓고 있다가 교수님한테 딱걸렸는데 스윽 보시더니 이 글과 비슷한 말씀을 하고 가셨습니다.

벌벌 떨며 추천합니다
ohmylove
16/03/09 17:13
수정 아이콘
이쪽 계열 교수님이세요?
16/03/09 19:13
수정 아이콘
네 저희 연구실에서 패턴인식, 기계학습 분야를 주로 합니다
ohmylove
16/03/09 19:14
수정 아이콘
흥미롭네요. 답변 감사합니다.
16/03/09 17:11
수정 아이콘
가장 정석으로 두어야 가능성이 있습니다.
16/03/09 17:11
수정 아이콘
신경망은 기존의 local minimum에 빠지지 않은 매커니즘을 그 최대 장점으로 하고 있는 만큼, 한 길로 쭈욱 나아가야 이길 가능성이 있습니다.
Judas Pain
16/03/09 17:14
수정 아이콘
감사합니다, 아름답네요. 지금 19*19 반상을 21*21, 22*22,.. 이런 식으로 계속 늘린다면 최고수 기사와 알파고 중 누구에게 더 유리할까요?
세종머앟괴꺼솟
16/03/09 17:17
수정 아이콘
21 * 21 판에서의 대국 기록이 충분히 존재한다면 기계 손 들어주겠습니다... 왜냐면 사람은 21 * 21에서 경험이 안 쌓여 있잖아요? 지금 같은 발전 속도면 search space가 넓어질수록 사람이 더 힘들어질 것 같습니다. 지금 당장이라면 기계를 학습시키는 것부터가 문제가 힘들고요.
16/03/09 17:17
수정 아이콘
알파고요.
피아노
16/03/09 17:46
수정 아이콘
아마 기계는 3차원 바둑도 둘 수 있을듯..
은때까치
16/03/09 17:21
수정 아이콘
몬테카를로를 policy network와 value network로 보완한거죠. 여기에 구글의 어마어마한 컴퓨팅 파워가 더해진거구요.
엄청나게 새로운 알고리즘은 아니라서 저는 진짜로 이길줄은 몰랐는데.. 진짜로.. 그 이세돌을..

정말 정말 놀랍고 흥분되네요. 역사에 남을 날입니다.
이진아
16/03/09 17:22
수정 아이콘
김기응 교수님이신가... 본문 설명의 퀄리티보소
회색사과
16/03/09 21:14
수정 아이콘
헉.... 무서운 이름이....
정말 교수님이 쓰신거면 재밌겠네요
꼭두서니색
16/03/10 13:41
수정 아이콘
반도의 흔한 박사과정입니다..크크
아리아
16/03/09 17:26
수정 아이콘
아무튼 오늘은 역사에 남을 것 같습니다
사회파괴
16/03/09 17:27
수정 아이콘
번역글 하나 올릴까 했는데 이미 좋은글을 올려주셨네요 감사합니다 잘봤습니다.
꼭두서니색
16/03/10 13:41
수정 아이콘
혹시 번역글의 원문 주소 알려주실 수 있을까요? 제 연구분야랑 겹치는 내용이 좀 있어서 관심있게 보고 있습니다.
몽키.D.루피
16/03/09 17:30
수정 아이콘
이글을 보니까 알파고의 승리가 인공지능의 특이점과는 어떤 상관관계가 있는지 궁금하네요. 딥러닝이라고는 하지만 경우의 수를 줄이는 알고리즘이 추가된 거에 불과한데 이런 인공지능이 인간을 지배할 것 같지는 않은데요..
16/03/09 17:39
수정 아이콘
지배를 위해서는 인간의 모든 영역을 커버해야 하는데 그만큼 디지털화도 안되어 있어서 사실 먼 훗날 이야기라고 개인적으로 생각합니다.
자유의영혼
16/03/09 18:09
수정 아이콘
하지만.. 1년전만 해도 바둑도 먼 훗날이라는 얘기가 나왔었다는걸 생각해보면..
16/03/09 21:07
수정 아이콘
단일 분야에 정통한 것과 여러 분야의 지식 연관성을 찾는건 또 다른 문제라고 개인적으로 보는 편이라..
물론 이 또한 개인적인 판단이라 추후에 어찌될지는 모르겠지만요 크크.

비슷한 것도 아니고 관련 분야에 머신 러닝을 도입하는데 쉽지 않더라고요.
명확하게 정의가 내려진 것이 아니라 사람의 머리 속에 있는 문서화 되지 않은 지식들의 경우 더더욱 답이 없더라구요.
16/03/09 17:45
수정 아이콘
https://coolspeed.wordpress.com/2016/01/03/the_ai_revolution_1_korean/
아직 안 읽어보셨다면 이 글을 읽어보시기를 권합니다.
스크롤 압박이 있기는 하지만 재미있습니다.
몽키.D.루피
16/03/09 19:47
수정 아이콘
저도 이 글 봤는데 다 이해했는지는 모르겠네요. 아무리 수학 연산이 빠르다고 해도 인간을 뛰어넘는다고 볼 수 없듯이 알파고가 만약 경우의 수를 효과적으로 제외시키는 알고리즘에 불과하다면 우리가 우려해야할 인공지능이라고 볼수 있을까라는 겁니다.
피아노
16/03/09 17:48
수정 아이콘
넹넹넹넹넹넹넹
16/03/09 17:38
수정 아이콘
이세돌이 5승하거나 알파고가 5승하거나 둘중 하나라고 생각하고 있었는데.. 으흠..

놀라운 감정보다는 무섭네요
돌민수
16/03/09 17:39
수정 아이콘
둘다 맵핵킨 바둑은 오케이일지 몰라도
스1갖곤 힘듭니다. 맵핵켠것처럼 행동하지 않는이상..
인공지능의 정찰을 차단하고 카운터 빌드만 먹여도 압승할테지요. 물론 리버 스캐럽으로 scv 1킬밖에 못하는 미친산개플레이는 기대되긴합니다.
사도세자
16/03/09 17:42
수정 아이콘
모르죠.개인적인 생각은 거의 무한수열에 가까운 바둑도 정복해냈는데(물론 아직 한경기지만) 스1정복하는건 시간문제 같네요.
돌민수
16/03/09 17:49
수정 아이콘
가스타이밍, 상대 일꾼의 수 등을 정찰을 통한 확인으로 경우의 수를 짜서 빌드를 맞춰가야할텐데 정찰을 차단하면 일단 어찌해볼도리가 없다고 봅니다.

정찰을 못한 인공지능은 알고리즘대로 많은 유저들이 선택하는 정석, 원겟후 앞마당 옵드라가야할텐데 그걸 노리고 바카닉이 쭉 나오면..
동네형
16/03/09 18:01
수정 아이콘
뭘해도 컨트롤에 막힙니다.
16/03/09 18:10
수정 아이콘
컨트롤에 막힌다는데 인공지능이 후킹을 통해서 스타2에 직접 명령을 하는 방식이 아니라, 마우스와 키보드를 시뮬레이션 하는 형태로 진행한다면 그렇게 될지를 알수가 없습니다.

요컨데 인간이 왼쪽으로 피할지 오른쪽으로 피할지 뺄지를 판단해야하고, 바둑과는 다르게 그 판단이 순간적으로 이루어져야 하죠...
Anthony Martial
16/03/09 18:51
수정 아이콘
여기서 말하는 건 명령내리는 방식이겠죠

예를들자면 현재 스1 컴퓨터레벨의
최종진화형태?
동네형
16/03/09 20:30
수정 아이콘
시뮬레이션이 필요가 없습니다.. 시야 안쪽 유닛의 사거리와 체력을 확인해가면서 내 모든 유닛이 동선 엉키지 않게 산개하고 무빙컨트롤하는데요.
16/03/09 23:19
수정 아이콘
그런데 시야 안쪽유닛의 사거리와 체력을 모두 확인했다 치더라도, 요컨데 예상하지 못한 언덕 시즈가 왔다고 한다면 그때 어떻게 대처해야하는지에 대해서 인간만큼 민첩해야된다는 겁니다.

동선엉키지 않게 산개하는 법이 인간한테는 직관적이지만, 컴퓨터는 계산이 필요하고, 그게 조금만 걸려도 피해가 생기겠죠.

그리고 현재 LOL 헬퍼등과 다르게, 마우스의 이동속도등을 그대로 시물레이션한다면, 컴퓨터는 짧은시간에 얘를 움직여서 살릴것인지, 아니면 죽일것인지를 판단해야합니다. (헬퍼 같이 마우스를 순간이동시키면 당연히 가능하지만, 알파고의 목적성상 그렇게 알리는 없을것 같습니다..)

또한 전투를 할때도 세세 유닛 콘트롤에 집중할것인지 생산을 더 해야할지 등도 판단요소구요.

스타1이 마린1마리로 컨이 아무리 좋아봤자, 드라군 3마리를 이길수는 없으니까요.

인공지능AI가 제일 셀수 있는건, 상대가 뭘할지를 볼때(맵핵, 애초에 지금 스타인공지능도 정찰없이 뭘하는지를 알죠) 이지 그게 어려워지면 인공지능이 인간처럼 순식간에 판단을 내리기 어려워지는 수도 있을 겁니다.

바둑은 시간을 오래 쓸수 있지만, 스타는 그런면에서 어려울수 있죠.
동네형
16/03/09 23:26
수정 아이콘
민첩의 개념이 아니라는 말입니다.. 앞마당에 일꾼 20마리가 미네랄에 붙어있을때.
언덕탱크가 한방 쏘면 왼쪽 오른쪽으로 일꾼 비벼지는 일 없게 '한마리씩' 잘라서 본진 자원으로 뺍니다.

뭐 이러한 저러한 제약을 고려하시는건 알겠으나.
그렇게 해서 이긴다 한들 팔다리 잘라내고 하는거라 어떠한 의미가 있는지 모르겠습니다.

그냥 이영호 피지컬을 가진 다른 사고를 가진 사람을 생각하시는건지요
16/03/09 23:32
수정 아이콘
팔다리를 자르고 하는건 아닙니다. 사람과 같은 조건인거죠. APM에 한계보다 마우스 이동거리의 한계를 둘 가능성이 더 높습니다. 앞마당에 일꾼 20마리가 한마리씩 본진자원으로 이동하려면, 그 컨을 하는데 걸리는 시간이 있을겁니다. 그게 0는 아닐거라는 겁니다.

그리고 애초에 '상대가 무엇을 하는지'를 적극적으로 알아야 합니다. 스타는 바둑처럼 상대두는걸 다 볼수있는게 아니죠. 정찰, 상대의 올인성 전략, 맵구조 등을 전부 익혀야 하는게 기본이 되기 때문에, 바둑보다는 난이도가 높다고 봅니다.
동네형
16/03/09 23:50
수정 아이콘
시츄 님// 글쎄요... 스타크래프트의 경우 저는 액션게임이라고 보기 때문에 피지컬을 상한선을 강제해놓는게 의미가 있을지 모르겠습니다. 어차피 컨트롤적인 면에서 우위에 있기 때문에 다섯번째 일꾼 보내면 문제 될껀 없습니다. 본진 보는순간 자원전부다 찍어봐서 채취량과 인구수 빌드타임 고려하면 나오는 빌드도 대부분 파악이 되구요.
16/03/10 00:35
수정 아이콘
동네형 님// 당연히 알파고가 피지컬로 이기는건 아니죠 그리고 피지컬이 높다고 다 이기는건 아니죠 프로만봐도 마찬가지인것같구요

본진에 일꾼을 보내서 채취량은 알수있을지언정 모든곳이 정찰되지않는다면 인구수도알수없죠

스타는 제대로 적을 속이기 쉬운게임입니다 멀티하는척하고 초반러쉬를 가거나 초반에 러쉬가는척하고 더블을갈수있죠. 컴퓨터는 제한된 보이는 정보로 판단을해야합니다..
마나통이밴댕이
16/03/09 21:17
수정 아이콘
초반 빌드, 정찰하는 행위, 정찰 막는 걸 뚫는 행위 등을 학습을 통해서 스스로 발전시킬 겁니다...
그리고 컨트롤은 로봇이랑 이미지 프로세서 만들어서 하는 걸로...
스덕선생
16/03/09 17:41
수정 아이콘
완벽한 수계산과 컨트롤이라면 옵드라만으로 모든 테란의 빌드를 상대를 카운터치는게 가능할지도 모르겠네요.
스2에선, 이미 많은 영상들에서 사기적인 컨트롤을 보여준 적 있죠. 그 컨트롤에 컴퓨터스러운 물량생산까지 나오면 뭐...
릴리스
16/03/09 17:53
수정 아이콘
로템이나 짐레이너스 메모리같은 앞마당에 언덕있는 맵이면 빌드 유리함은 적을 것으로 보이네요.
16/03/09 17:42
수정 아이콘
이제 거대한 권력의 개편의 움직이 있겠네요. 인공지능 컴퓨터를 손에 넣으려는 자와 견제하려는 세력.
경제, 통신, 사회, 군사 문제까지 인공지능에 따라 패러다임이 바뀌겠네요.

물론 그 선두는 구글과 글로벌 기업이겠지만, 각 국가의 개발 전쟁도 엄청나겠네요,
16/03/09 18:03
수정 아이콘
학습을 한다는게 의미가 있네요
착한 외계인
16/03/09 18:37
수정 아이콘
근 미래가 되면 특정 종목에 관해 사람이 인공 지능을 이기면 어마 어마한 화제가 되는 광경을 보게 되겠네요.
신의와배신
16/03/09 20:06
수정 아이콘
헌터x헌터에서 눈먼 여고수가 보드게임으로 개미왕을 이기는 광경이 생각납니다
개념테란
16/03/09 19:18
수정 아이콘
첫판을 져버리니 충격이네요. 결국 저 방식은 노가다를 엄청해서 가장 승률 좋은 수를 놓는 형태이기 때문에 진정한 의미의 인공지능은 아니고 실수만 하지 않는다면 아직은 인간이 이길 수 있다고 믿습니다. 입력된 규칙으로 컴퓨터가 스스로 생각하는 세상이 오면 얘기가 많이 달라지겠죠.
신의와배신
16/03/09 20:05
수정 아이콘
저는 인간이 생각하는 방식은 기계와 얼마나 다른가라는 쪽에서 접근해봐야하다고 봅니다.

알파고의 바둑 공부는 인간의 공부법과 차이가 없습니다. 바둑해설에서도 나타났듯이 이런 모양에서는 가능한 수단이 세가지가 있다. 제1감에 따르면 .... 좋은 결과가 안나옵니다. 제2감도 그렇네요. 제3의 감도 결론이 안좋습니다. 이렇다면 다른 방법을 생각해봐야합니다.
컴퓨터가 스스로 생각하지 않은 것이라고 판단할 근거는 어디에도 없습니다. 인간과 같은 방식의 생각을 보다 깊게 착오없이 한 것입니다.

도리어 컴퓨터가 인간과 완전히 같은 방식으로 더 깊게 한수의 가치를 이해하게 되었다고 봅니다.
물만난고기
16/03/09 20:59
수정 아이콘
위의 알고리즘을 따져보면 결국 형세판단을 하고 그 다음 최적의 수 찾기 인데 이건 사람도 마찬가지죠.
다만 아직은 미세한 수읽기나 감이라 부르는 통찰력인 부분에서 사람이 좀더 낫지 않나싶고요. 이번 1차전에서도 이세돌이 실수를 통해 유불리를 내줬다라고 말들하니 2차전에서 각오를 다진 이세돌이 이길 것 같습니다.
바카스
16/03/09 22:08
수정 아이콘
스타1 이야기는 진짜인가요??
꼭두서니색
16/03/10 13:41
수정 아이콘
게임 뉴스 게시판에 관련 뉴스가 올라와 있습니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
공지 [정치] [공지] 정치카테고리 운영 규칙을 변경합니다. [허들 적용 완료] [126] 오호 20/12/30 275403 0
공지 [일반] 자유게시판 글 작성시의 표현 사용에 대해 다시 공지드립니다. [16] empty 19/02/25 341434 10
공지 [일반] [필독] 성인 정보를 포함하는 글에 대한 공지입니다 [51] OrBef 16/05/03 463370 29
공지 [일반] 통합 규정(2019.11.8. 개정) [2] jjohny=쿠마 19/11/08 337688 3
102716 [일반] 요즘 근황 [14] 공기청정기2222 24/11/21 2222 6
102715 [일반] 좋아하는 꽃은 무엇일까요? 출간 이벤트 당첨자 발표와 함께! [9] 망각870 24/11/21 870 3
102714 [정치] 한동훈, 당내게시판 윤석열 비방 관련 경찰 요청 거부 [91] 물러나라Y5625 24/11/21 5625 0
102713 [일반] 아니, 국과수도 모르겠다는데... 설마 대법원까지 보내려고 할까요? [31] 烏鳳5945 24/11/21 5945 24
102712 [정치] (채상병 사건) 박정훈 대령이 군검찰로부터 징역3년을 구형받았습니다. [71] 꽃이나까잡숴5478 24/11/21 5478 0
102711 [일반] 4년간 미국 물가는 얼마나 심각하게 올랐는가 [57] 예루리3505 24/11/21 3505 1
102710 [정치] 메르스 이후 처음으로 주요 그룹 사장단 긴급성명 발표 [67] 깃털달린뱀5435 24/11/21 5435 0
102709 [일반] 트럼프 2기 정부는 불법 이민자 문제로 시작합니다 (+ 생각보다 빠르게 진행되는 트럼프 공약) [62] 시드라3691 24/11/21 3691 1
102708 [일반] 페이커 "실패 하나하나 모여 지금의 나…청년들 도전하세요" [45] 덴드로븀3422 24/11/21 3422 15
102707 [일반] 넷플릭스 영화 전,란에서 보여지는 역사왜곡 문제 [28] 뭉땡쓰2544 24/11/21 2544 11
102706 [일반] (수정)백종원표 더본코리아의 오늘까지의 주가추이 및 개인적인 의견 [45] 독서상품권4147 24/11/21 4147 1
102705 [일반] 피지알 회원들의 AI 포럼 참가 후기 [20] 최애의AI5320 24/11/20 5320 36
102704 [일반] AI 시대, 사교육 방향이 근본적으로 수정되어야 할 이유 [25] 스폰지뚱5092 24/11/20 5092 8
102703 [일반] 영화 청설 추천합니다 [16] 퀵소희4213 24/11/20 4213 1
102702 [정치] 감리교회의 반동성애 기류는 더욱 심해지고 강해지고 있습니다. [31] 라이언 덕후5174 24/11/20 5174 0
102701 [일반] 구조조정 바람이 거세지는 요즘 드는 생각들 [79] 수지짜응8191 24/11/20 8191 2
102700 [일반] 한나라가 멸망한 이유: 내우(內憂) [10] 식별2298 24/11/20 2298 26
102699 [일반] 우크라이나 내 전쟁여론 근황 종전 찬성 52% 반대 38% [121] 뭉땡쓰7381 24/11/20 7381 1
102698 [정치] 트럼프의 집권은 오바마에 대한 실망이 가장 큰 이유였다고 생각되네요. [93] 홍철8871 24/11/20 8871 0
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로