最新热点新闻网,汇聚最新最热新闻!

帮助中心 广告联系

最新焦点新闻网

热门关键词:

Master60战全胜 揭:谷歌alphago为什么会下围棋 程序原理下载简介(10)

来源:未知 作者:admin 人气: 发布时间:2017-01-05
摘要:AlphaGo阿尔法围棋简介 阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯哈萨比斯、大卫席尔瓦、黄士杰和与他们的团队开发。其主要工作原理是深度学习。这个程序在2016年3

www.jdxwnews.com

AlphaGo阿尔法围棋简介
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰和与他们的团队开发。其主要工作原理是“深度学习”。这个程序在2016年3月与围棋世界冠军、职业九段选手李世石进行人机大战,并以4:1的总比分获胜。不少职业围棋手认为,阿尔法围棋的棋力已经达到甚至超过围棋职业九段水平,在世界职业围棋排名中,其等级分曾经超过排名人类第一的棋手柯洁。
2016年岁末,在国内棋类网站弈城网上出现了一个类似“围棋上帝”的账号(“围棋上帝”是指每一步都绝对正确,每一步都绝对算到,洞悉全局的一切),在2016年12月29日至31日的3天时间里,神秘高手连胜柯洁九段、陈耀烨九段、朴廷桓九段、芈昱廷九段、唐韦星九段等高手。
程序原理
深度学习
阿尔法围棋(AlphaGo)是一款围棋人工智能程序。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。 www.jdxwnews.com
这个程序主要包括4个部分:
1. 走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。
2. 快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。
3. 估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。
4. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。

责任编辑:www.jdxwnews.com

最新热点新闻网出品

最新最热头条新闻资讯

手机:1885712713 邮箱:89894440901@qq.com
联系电话:010-8888888 地址: