- 새로운 뉴스를 올려주세요.
Date 17/10/19 07:10:12
Name   구밀복검
File #1   AKR20171018131600017_02_i_20171019020118403.jpg (55.0 KB), Download : 7
Subject   스스로 바둑 깨우친 '알파고 제로' 나왔다…'AI 신기원'


http://www.yonhapnews.co.kr/bulletin/2017/10/18/0200000000AKR20171018131600017.HTML


(전략)....알파고 제로는 교과서나 기보는커녕 대국 상대조차 없이 순수한 독학으로 바둑을 익혔는데도, 인간 고수들과 기존 알파고 버전들을 압도하는 능력을 갖추게 됐다. 이는 인간이 미리 정해 놓은 정석을 외우거나 기보를 학습하는 방식으로 바둑을 배웠던 기존 버전들과는 다른 점으로, '인간의 한계를 뛰어넘는' 인공지능 연구의 중요한 이정표가 될 것이라고 연구진은 강조했다...(후략)


그래프가 충격적이네요. 인간에게 배우는 게 당장은 빨리 실력이 늘지만 얼마 안 가서 인간에게 배우지 않은 쪽이 역전한다는 것을 보여줍니다.
자연지를 인간에게 배우는 건 언발에 오줌누기일 뿐 좆되는 길이로구나..지능이 '인간' 당했네.

레퍼런스는 Mastering the game of Go without human knowledge 네요. 논문 주소 : https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html

------
댓글 추천 받고 칼럼 링크 추가합니다.
https://brunch.co.kr/@madlymissyou/18



2


CONTAXS2
기원도 안다녔다고요?
구밀복검
기원 다니면 재능을 오염시키는 거래요..ㄷㄷ...
BibGourmand
사실인지 그냥 지어내서 떠도는 썰인지는 모르겠는데, 모차르트 일화가 떠오르네요.
'음악을 배운 적이 없다면 수업료를 반만 내고, 다른 데서 배운 적이 있다면 두 배로 내라'
사람들이 항의하자 '모르는 걸 가르치긴 쉬워도 잘못 배운 걸 교정하는 건 어렵다'고 했다지요.

사람한테 잘못 배운(!) 바둑이 저렇게 무섭습니다 ㅠㅠ
구밀복검
신경에 새 패턴을 입력하는 것보다 기존 패턴을 지우고 새 패턴을 입력하는 게 훨씬 어렵다는 건 다들 아는 거긴 한데...시간의 제약이 거의 없다시피한 알파고조차도 경로 의존적으로 입력된 체계를 근본부터 검토하여 가역적으로 재구성하는 건 불가능하다는 걸 보여주지 않나 합니다. 결국 알파고 역시도 진화적으로만 인지를 수행하는 것이지 그걸 역행하지는 못하는 게 아닌가 싶고.
유리소년
supervised learning은 인간들이 선학에게서 '배운다'는 개념보다는 훈련데이터 내에서의 경향성을 '따라한다'는 개념이라..
뭐 이 예에서는 그게그거 같긴 하군여
구밀복검
경로의존적 학습을 했다는 이야기겠죠.
A long-standing goal of artificial intelligence is an algorithm that learns, tabula rasa, superhuman proficiency in challenging domains. Recently, AlphaGo became the first program to defeat a world champion in the game of Go. The tree search in AlphaGo evaluated positions and selected moves using de... 더 보기
A long-standing goal of artificial intelligence is an algorithm that learns, tabula rasa, superhuman proficiency in challenging domains. Recently, AlphaGo became the first program to defeat a world champion in the game of Go. The tree search in AlphaGo evaluated positions and selected moves using deep neural networks. These neural networks were trained by supervised learning from human expert moves, and by reinforcement learning from self-play. Here we introduce an algorithm based solely on reinforcement learning, without human data, guidance or domain knowledge beyond game rules. AlphaGo becomes its own teacher: a neural network is trained to predict AlphaGo’s own move selections and also the winner of AlphaGo’s games. This neural network improves the strength of the tree search, resulting in higher quality move selection and stronger self-play in the next iteration. Starting tabula rasa, our new program AlphaGo Zero achieved superhuman performance, winning 100–0 against the previously published, champion-defeating AlphaGo.
(인공 지능이 오랫동안 설정했던 목표는, 백지 상태(tabula rasa)로부터 시작하여 여러 도전적인 영역에서 초인간적인 숙련을 학습하는 알고리즘이었다. 근래에 들어 알파고는 바둑 세계 챔피언을 이긴 최초의 프로그램이 되었다. 알파고가 내장한 트리 검색(tree search)은 심층신경망(deep neural network)를 이용하여 형세를 판단하고, 다음 수를 선택한다. 이러한 신경망은 인간 '고수'의 수에 기반을 둔 지도 학습(supervised learning)과, 스스로 게임을 수행하며 얻는 강화 학습(reinforcement learning)을 통해 훈련되었다. 이 논문에서 우리는 오직 강화 학습에 기반을 둔 알고리즘을 도입했다. 게임의 규칙을 넘어서는, 기보(human data)나 지도(guidance) 혹은 주요 지식(domain knowledge)은 이용하지 않았다. 알파고는 그 자신의 교사가 되었다: 신경망은 알파고 자신의 수와 자신이 수행하는 게임의 승자를 예측하도록 설정(is trained to; 훈련?)되었다. 이 신경망은 트리 검색의 힘을 개선하고, 그 결과 다음 반복 때는 더 강화된 자기 대국(self-play)과, 더 고차원적인 수 판단을 실행한다. 백지에서부터 시작하여, 우리의 새로운 프로그램인 알파고 제로(AlphaGo Zero)는 초인적인 성과를 달성했다. 바둑 챔피언을 이긴 기존 알파고와의 대국에서는 100:0으로 승리했다)

초록만 봐서는 영 아리까리 하네요. 오늘 목표로 한 공부량을 끝내면 본문도 찾아봐야겠어요. 기사에서 논문을 소개하는 것은 영 믿을 수가 없더라고요ㅠ
이게 커제 대국 버전이죠? 이세돌 버전과 100승 무패라는게 충격이네요. 아 기사보니 그 다음 버전이군요
네 그것도 넘었다고...이번에 나온 제로 베이스 알파고가 이세돌 버전 알파고가 100승 0패를 기록했고, 커제 버전 알파고 상대로는 89승 11패라고 합니다. 제일 재미있는 건 기보 학습으로는 커제 버전은 커녕 이세돌 버전 알파고의 실력을 못 뛰어넘었는데 제로 베이스로 강화 학습만 하니 뛰어넘었다고.
역시 인간 따위는 걸림돌이군요.
현재까지 한글로 된 기사/논평은 이게 제일 좋아 보입니다. 읽고 괜찮으심 본문에 추가해주시길
https://brunch.co.kr/@madlymissyou/18

지난번 알파고마스터 버전 50개 기보가 그렇게 충격이었다는데.. 이 제로버전 기보는 거의 규화보전 급이겠습니다 ㅎㅎ. 바둑계가 몸달 듯.
찾아보니 이미 신버전도 기보 공개를 했군요.. 해석을 못하는 분위기
정말-그러겠네요ㄷㄷㄷ
구밀복검
기보 학습으로는 학습에 경로의존적인 한계가 설정된다는 건, 결국 알파고 제로의 기보를 줘봐야 인간은 학습 못하는 게 아닐까 싶기도 하네요 ㅋㅋ
뭐 이기진 못하겠지만 알파고가 찾아낸 '신 정석' 같은거만 혼자 갖고 있으면 거의 무림비급 수준으로 인식되지 않을까요? ㅋ 너무 상상인가. 일단 돈이 오가는 판이니 말입니다.
구밀복검
재미있긴 하겠네요. 알파고 제로표 포석을 흉내냈는데 상대 기사가 그걸 노리고 판을 꼬아버릴 때, 알파고처럼 수순 계산을 못하는 인간이 어떤 식으로 임시방편 응용력을 발휘할 거냐..소위 '좆밥 싸움이 더 재미있다'는 말이 진담이 될지도 모르겠습니다 ㅋㅋㅋ
AI가 발전하면 인간은 그 AI의 뜻을 해석하는게 주 업이라는 이야길 옆동네 소설평에서 들은거 같은데.. 이게 사실 커제전 이후 프로바둑계가 몸으로 보여준게 아닌가 해서 말이죠. 이해는 못하는데 알파고 스타일로 따라하면 승률은 높아진다라는 이야길 들은 적이 있어요.

이렇게 단일한 알고리즘이 있고, 승패 (True or false)가 명확해서 바로 피드백을 줄 수 있는 영역에서는 강화학습이 진짜 길이란게 일단 증명되었네요. 데이터를 무한정으로 생산 가능하다는 전제가 있어야 하겠지만. 상대적으로 데이터양이 한정되어 있는 영역이거나... 더 보기
AI가 발전하면 인간은 그 AI의 뜻을 해석하는게 주 업이라는 이야길 옆동네 소설평에서 들은거 같은데.. 이게 사실 커제전 이후 프로바둑계가 몸으로 보여준게 아닌가 해서 말이죠. 이해는 못하는데 알파고 스타일로 따라하면 승률은 높아진다라는 이야길 들은 적이 있어요.

이렇게 단일한 알고리즘이 있고, 승패 (True or false)가 명확해서 바로 피드백을 줄 수 있는 영역에서는 강화학습이 진짜 길이란게 일단 증명되었네요. 데이터를 무한정으로 생산 가능하다는 전제가 있어야 하겠지만. 상대적으로 데이터양이 한정되어 있는 영역이거나, 승패가 명확하지 않은 영역에선 그나마 좀 버틸 수 있는데, 이쪽도 augmented CNN같은 데이터 뻥튀기라던지, 승패 마저도 다른 AI가 계산해줄 수 있다면 정말 디스토피아는 눈앞일지도 모르겠습니다. 빨리 블레이드러너를 보러가야 하는데.
유리소년
ㅎㅎ 인간 기사에게 1만 시간쯤이 주어진다면 인간들과 바둑을 연구하는 것보다는 그 시간에 코딩을 배워서 딥마인드가 낸 논문을 그대로 구현한 뒤 좋은 컴퓨터를 사서 생성한 기보들을 연구하는 게 더 낫겠네요. 실제로 알파고가 이세돌 이긴 이후 각 나라들에서 알파고에 모티브를 받아 제작한 supervised+reinforcement 기반 짭파고들도 인간 최정상 기사들의 기력을 내고 있고..
레지엔
닝겐 나부랭이의 재능으로 AI느님의 실링을 재려하지 말라는건가...
구밀복검
비트겐슈타인이 일정 시기 이후 러셀을 멀리한 이유...훠이훠이
음.. 사실 어떤 제대로 된 조작화된 알고리즘을 찾기만 한다면 그 알고리즘을 통한 학습력은 인공지능을 인간이 따라잡을 수가 없겠죠.

인간이 정말 100% 할 것이 없게 되는 때는 아마도 인공지능이 새로이 논문을 쓰거나 혹은 물리학 이론을 고안하거나 혹은 완전히 독창적인 발명품을 스스로 생각해서 만들거나 그 수준이어야 할 것 같아요.

뭐 이 정도의 약인공지능 수준에서도 이미 대부분의 인간이 할 일들은 사라질 수 있겠지만..
April_fool
알파고님 충성충성충성
Hong10Kong20
알파고 기보는 http://www.alphago-games.com/
제가 7급 수준의 초보라 이해도는 떨어지지만, 알파고 마스터 버전보다 더 물샐틈이 없어 보입니다.

Unsupervised learning인 것은 진심 확실하네요
http://www.alphago-games.com/view/eve... 더 보기
알파고 기보는 http://www.alphago-games.com/
제가 7급 수준의 초보라 이해도는 떨어지지만, 알파고 마스터 버전보다 더 물샐틈이 없어 보입니다.

Unsupervised learning인 것은 진심 확실하네요
http://www.alphago-games.com/view/event/1/game/0/move/50
최양락이 알까기 하는 기보에서 서서히 신선놀음이 되어 갑니다.

그래도.... 우리에겐 마지막 영광의 순간이 있지요.
http://www.alphago-games.com/view/event/13/game/3/move/78
미국에서 밤새면서 봤던 기억이 아직도 생생하네요.
목록
번호 제목 이름 날짜 조회 추천
14578 방송/연예'나영석·정유미 불륜설' 작성·유포한 방송작가 등 덜미 7 swear 19/02/12 6312 0
21017 IT/컴퓨터여성계 "정부, 게임업계 여성혐오 실태 조사 즉각 시행해야" 6 The xian 20/07/15 6302 5
23406 정치조세연구원장 "보유세 낼 능력 없다면 이사 가면 된다" 72 주식하는 제로스 21/02/23 6281 0
14 기타젊은 남성은 왜 여성을 혐오하는가 16 님니리님님 16/09/01 6267 0
11265 의료/건강고혈압 약 확인해보세요… '발암 물질 함유' 219개 판매 중지 19 April_fool 18/07/07 6263 0
22755 외신아스트라제네카 떡상각? 38 구밀복검 20/12/27 6262 3
7974 문화/예술최영미 ‘미투’ 이후 이문열의 1994년작 〈사로잡힌 악령〉 다시 주목 5 이울 18/02/08 6251 0
12678 방송/연예아이유, 배두나와 테니스 소재 단편영화 캐스팅..스크린 첫 주연 2 벤쟈민 18/09/12 6234 0
21649 기타50톤도 들썩 '폭풍해일' 비상…침수 전에 대피 4 하트필드 20/09/06 6228 0
20984 댓글잠금 정치'성추행 혐의'로 고소된, 64세 박모씨가 숨졌다 40 swear 20/07/12 6224 15
24849 댓글잠금 사회“백신 소외시켜놓고, 코로나 확산이 우리 탓?”…2030 ‘부글’[촉!] 80 Groot 21/07/08 6220 0
17199 사회도넘은 공기업 정규직화…이번엔 건보 1600명 53 Fate 19/10/21 6216 8
18441 사회말년병장 "군인 두발 제한은 위헌".. 헌재 "너무 늦어" 33 Schweigen 20/02/01 6213 0
28549 정치방송3사 "李 47.8% 尹 48.4%" JTBC "李 48.4% 尹 47.7%"(종합) 84 다군 22/03/09 6174 0
25839 기타‘대장동 개발’ 논란, 알려진 것과 잘 알려지지 않은 것들 54 절름발이이리 21/09/21 6174 7
18986 댓글잠금 정치문재인 "지금으로선 중국발 입국금지 실효성 없어" 71 나림 20/02/28 6173 2
13233 사회양심적 병역거부자 “대체복무 기간 36개월? 가혹…인권적으로 후퇴” 91 tannenbaum 18/11/04 6170 2
21020 IT/컴퓨터오바마·바이든·빌 게이츠 트위터 뚫렸다…"최악 해킹사태"(종합2보) 7 다군 20/07/16 6167 0
30831 정치국민 10명 중 7명 “여야, 제 역할 못해” 부정평가 26 매뉴물있뉴 22/08/11 6166 0
9456 IT/컴퓨터구글 인공지능 톡투북스(Talk to Books) 서비스 공개 3 moira 18/04/17 6159 0
20469 과학/기술'우주여행 시대' 성큼..스페이스X, 첫 민간 유인선 발사 9 토끼모자를쓴펭귄 20/06/01 6137 2
16469 정치조국 딸 논문 등재·장학금 '논란'…평생 無시험 진학도 '재조명' 66 이노우에나오야 19/08/20 6131 3
20544 사회치과의사 7000명 집결 강행..서울시 "환자 발생시 구상권" 70 맥주만땅 20/06/05 6116 2
5887 IT/컴퓨터스스로 바둑 깨우친 '알파고 제로' 나왔다…'AI 신기원' 24 구밀복검 17/10/19 6116 2
5515 문화/예술흔한 섹스로봇 소재 식상…문제에 대한 답 이상의 질문 던져야 35 moira 17/09/26 6109 1
목록

+ : 최근 6시간내에 달린 댓글
+ : 최근 12시간내에 달린 댓글

댓글
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기