AlphaGo赢的关键 自我对弈学习错误

人气 287
标签: ,

【大纪元2016年03月18日讯】(中央社)Google旗下DeepMind公司开发的人工智慧系统AlphaGo以4比1挑战韩国围棋天才李世石成功,系统主要开发者黄士杰今指出,AlphaGo每天会跟自己下棋,强化分析能力。

来自台湾的黄士杰目前在总部设于伦敦的DeepMind担任资深研究员,也是AlphaGo的主要程式开发者。AlphaGo与李世石进行5场人机对弈,拿下4比1成绩,都是由黄士杰负责在现场替AlphaGo摆棋。

黄士杰今天出席“AlphaGo解密”人机对弈赛后媒体聚会时表示,AlphaGo会变得这么厉害,是因为有子网路跟策略网路,其中策略网路从大约20万到30万的人类棋谱学习,减少搜寻广度;子网路则在搜寻进行到某种程度时,判断现在谁处于优势,可减少搜寻深度。

Google人工智慧系统AlphaGo的主要开发者黄士杰18日出席人机对弈赛后媒体聚会,分享AlphaGo开发公司DeepMind的愿景。(中央社)

Google人工智慧系统AlphaGo的主要开发者黄士杰(前排左)18日出席人机对弈赛后媒体聚会,分享AlphaGo开发公司DeepMind的愿景。(中央社)

黄士杰解释,透过策略网路和子网路,可以将盘面资讯撷取到可以处理的范围,让AlphaGo分析出目前最佳的10到20步棋。

他也透露,AlphaGo每天都自己跟自己下棋,让子网路透过自我对弈成长,从错误中学习,因为AlphaGo不会累,每天“下几百万盘都没问题”,这是子网路这么强大的关键。

黄士杰强调,AlphaGo进步的关键在于深度学习,若少了策略网路与子网路,就会大大降低棋力,这2大网路加入后,搜寻效能大幅提高,不过团队一开始也不确定能否成功,也有很多失败的经验。

对于外界顾虑太聪明的人工智慧系统最终可能反噬人类,黄士杰表示,这是很多人讨论的问题,DeepMind与其执行长也非常重视,不过Google有成立伦理委员会,负责评估人工智慧造成的影响,他相信人工智慧系统是中性的,科技没有好坏,端看人怎么使用。

黄士杰说,AlphaGo的下一步还在讨论中,DeepMind另有团队计划将人工智慧系统发展到医疗应用,例如可透过大数据分析病症,但该专案不是由他负责,他并不清楚具体内容。

对于台湾人工智慧人才的建议,黄士杰表示,台湾很多教授与研究人员实力不输国外,不过国外研究员的企图心很强,虽然都是离乡背井,但是心理上很积极,跟台湾不太一样。他建议台湾研究人才从小培养英文听说能力,到了有机会出国做研究的时候,就可以很顺利跟各国人才沟通。

相关新闻
电脑三胜棋王李世石 围棋对弈目的是什么
李世石战AlphaGo连3输 台2美女棋士挺棋王
棋王李世石首胜称永生难忘 发现电脑2弱点
电脑役于人脑  人机对决人类最终赢家
如果您有新闻线索或资料给大纪元,请进入安全投稿爆料平台
评论