PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2021/03/03 14:30:40
Name 타카이
출처 https://gizmodo.com/an-ai-was-taught-to-play-the-worlds-hardest-video-game-1846388137
Subject [기타] 기계학습으로도 정복할 수 없는 게임
QWOP
QWOP_screenshot.jpg

더러운 조작감을 가진 게임 QWOP를
기계학습 알고리듬을 이용해 학습시켰지만 만족스러운 결과가 나오지 않아서
QWOP 최고 스피드 러너의 플레잉 50개 영상을 학습시키고 연습시켰지만
speedrun.com 기록상 100m 기록 세계 10위인 1분 8초로 마무리 되었다고 합니다.(1위 기록 48초...)

더 좋은 개발자나 더 좋은 성능의 AI의 도전이 필요합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
21/03/03 14:32
수정 아이콘
스펠렁키 2 시키면 알파고도 패드 집어던지지 않을까...
40년모솔탈출
21/03/03 15:19
수정 아이콘
스펠렁키 멀티 플레이 전멸콤보 맛좀 봐야...
카라카스
21/03/03 14:36
수정 아이콘
스카이넷을 앞당기고 있네요..
티모대위
21/03/03 14:37
수정 아이콘
현재로서는 기계학습이 효율적이려면 사람이 플레이하는 속도보다 훨씬 빠르게 내부 시뮬레이션,학습이 가능한 환경이 되어야 할듯..
이 게임도 게임의 코드를 통째로 AI에 밀어넣고 고속으로 돌리면 금방 인간을 뛰어넘겠죠.
짬뽕순두부
21/03/03 15:07
수정 아이콘
알파고 : 아 조작감 뭣같네 진짜...!!
21/03/03 15:08
수정 아이콘
이런거 예전에 일본사람이 유전 알고리즘으로 최적화하는거 봤던것 같은데...
-안군-
21/03/03 15:24
수정 아이콘
왠지 설계에 문제가 있었을 것 같은... 딥마인드가 했다면 결과는 달랐을 것 같네요.
기계학습쪽을 요새 좀 파고 있는데, 이게 생각보다 무작정 한다고 되는게 아니더라고요.
어떤 학습방법을 쓸것이고, 피드백은 어떻게 할 것이며, 학습결과가 편향되지 않도록 하는 것 등등 고려할게 엄청 많아요.
21/03/03 15:44
수정 아이콘
유튜브보니 딥마인드 딥큐러닝 논문보고 참고했다고 하네요. 딥마인드 회사 전체도 필요없이 머신러닝 엔지니어 한명이면 될듯
-안군-
21/03/03 15:46
수정 아이콘
DQN 논문은 사실 강화학습 방식에 대한 원론만 제시한거고, 세세한 튜닝에 대해서는 언급이 안돼있죠.
딥마인드 회사 전체도 아니고, DQN 저자중 한명만 있었어도 저것보다는 훨씬 성능이 좋았을것 같긴 합니다.
21/03/03 15:55
수정 아이콘
사실 알파고는 튜닝문제보단 알고리즘과 트레이닝 스케일링 문제라.. 튜닝엔 꽤나 Robust한걸로 알고있습니다.
-안군-
21/03/03 16:01
수정 아이콘
퉁쳐서 튜닝이라 한거죠;,
사실 알파고도 강화학습 방식 자체는 기존의 DQN과 큰 차이는 없다고 보고, 최적화를 위해 몬테카를로 탐색방식을 쓴게 신의 한수라 보거든요.
근데 QWOP 같은 게임은 경우의 수도 적어서 몬테카를로 같은건 필요없을것 같고... 결국은 튜닝과 피드백의 문제일거라고 예상이 되네요.
21/03/03 16:13
수정 아이콘
몬테카를로 탐색은 알파고 전부터 바둑ai 에선 흔히 쓰던 알고리즘입니다.
구글이 엄청난 컴퓨트를 가지고 딥러닝 스케일링과 강화학습 알고리즘 문제를 해결한게 큽니다.
태정태세비욘세
21/03/03 16:05
수정 아이콘
current status를 어떻게 읽었는지가 궁금하네요
숫자인가 화면인가..
Chasingthegoals
21/03/03 16:49
수정 아이콘
A.I도 실습하다가 샷건 쳤을 것 같은데 크크크
21/03/03 18:03
수정 아이콘
사람보다 훨씬 쉽게 잘할거 같은데... 만든사람 능력문젠듯
주파수
21/03/03 20:26
수정 아이콘
저러다가 울트론 나오는 거구나..
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
415380 [유머] 셀렉션 딸기 vs 초코 결과 [19] 추천11184 21/03/05 11184
415379 [유머] 천문학적 농담 [7] K-DD12574 21/03/05 12574
415378 [기타] 호르몬 냄새...남자가 잘못했네 [157] 흰둥17413 21/03/05 17413
415377 [LOL] 어제 경기끝나고 T1에대한 외국해설자 코멘트 [18] 달달합니다9580 21/03/05 9580
415376 [유머] 어머니.. 나 이제 깨달아요...jpg [36] 마늘빵15917 21/03/05 15917
415375 [기타] 협찬광고 모델을 너무 예쁜 사람 쓰면 안되는 이유 [29] 묻고 더블로 가!15150 21/03/05 15150
415374 [LOL] T1부터 브리온까지 플레이오프 2장 싸움 / 남은 대진일정 [50] 아롱이다롱이10603 21/03/05 10603
415373 [유머] 짐을 내려보아요 [20] 길갈9906 21/03/05 9906
415372 [LOL] 티강아 [8] iwyh8991 21/03/05 8991
415371 [기타] 원양어선 1인실 [37] 와칸나이12908 21/03/05 12908
415370 [게임] 꾸준히 노력하면 누구나 가능하다는 희망을 준 게임 [42] 똥꾼10599 21/03/05 10599
415369 [게임] 이미 인게임 재화까지 확률을 공개한 게임 [7] 저스디스9085 21/03/05 9085
415368 [유머] 덕질로 교수님 마음 사로잡기.jpg [8] 추천10514 21/03/05 10514
415367 [게임] 2019년에 작두 탄 늅뉴비님...(feat. 랜덤 보상) [2] Cafe_Seokguram6809 21/03/05 6809
415366 [게임] 레니아워가 설명하는 실바나스 스토리.youtube [20] 예킨야8509 21/03/05 8509
415365 [유머] [주식] 흔한 K-정치테마주 [24] 2021반드시합격11616 21/03/05 11616
415364 [게임] 넥슨 승부수 던졌다 “유료 강화·합성류까지 전면 확률 공개” [34] 마늘빵11910 21/03/05 11910
415363 [LOL] 다이아 랭크 전프로 vs 일반인 [34] Lord Be Goja9894 21/03/05 9894
415362 [기타] USB 허브 구입하고 후회 중 [41] BTS12716 21/03/05 12716
415361 [게임] 김실장 레전드 [17] 도련12150 21/03/05 12150
415360 [유머] 아이폰 자동완성 참사..jpg [9] Starlord10621 21/03/05 10621
415359 [기타] 배민 리뷰... [10] 추천9814 21/03/05 9814
415358 [게임] 알고리즘때문에 다시보게된 레전드영상 [16] 문문문무10668 21/03/05 10668
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로