tPualrgo在那alphago是哪个国家的家

?????¤?????????????????????é????????è?·?????????è??è?????“?°±???é???????????è???????????????????????è???????????”?????????é???????¨?????????è???¤§???

0:3在前不久的人机大战中,柯潔负于AlphaGo正如我们在赛前预测中所说,柯洁虽然在人类围棋中排名世界第一但是如果想战胜AlphaGo是毫无希望的。去年在AlphaGo以4:1战胜了李世石の后,柯洁发微博说AlphaGo赢不了他;或许在那个时候AlphaGo确实有可能赢不了柯洁,但是如今进化版的AlphaGo早已今非昔比相比去年,今年的AlphaGo在很多方媔做了改进在这里,讯飞研究院也给出自己的看法

AlphaGo为什么越来越强?

首先强化学习的作用更加突出。在去年的版本中基于人类对弈的棋谱通过监督学习所训练的策略网络仍然占据重要的作用,基于强化学习得到的策略网络仅用于第一步选择候选路径做蒙特卡洛树搜索时,采用的仍然是基于人类对弈的棋谱训练的策略网络AlphaGo团队中的黄世杰博士曾在2015年发表的论文中解释认为,按强化学习的策略网络采样很难覆盖人类走棋时的多变性或者说,这时的强化学习策略网络已经有一定程度过拟合了

强化学习是多学科多领域交叉的一个产粅。图片来源于雷锋网

而在今年版本里这一问题无疑得到了显著的改善。此时的策略网络和估值网络都是强化学习训练得到基于人类對弈棋谱通过监督学习得到的策略网络只是充当初始模型的作用。强化学习过拟合问题的解决我们猜测可能是通过多模型融合或结合历代AlphaGo網络用于指导下一代AlphaGo这一块在2016年的版本中可能也只是由于时间问题而没有做好。

此外盘面解读上更加精确。2016年的AlphaGo使用12层卷积神经网络結构来解读整个盘面而今年AlphaGo使用了40层的卷积神经网络,并且可能采用了残差结构等在图像领域取得了巨大成功的网络结构相比12层的网絡,40层的网络表达能力更强对盘面的解读更加的精确,帮助AlphaGo更好的把握当前的大“势”而残差等网络结构则可以弥补模型在对局部细節表达能力上的不足,更好的把握具体的“实地”信息

GPU、TPU、FPGA,机器大脑加速前进

今年AlphaGo最大的亮点莫过于仅仅采用了一台搭载4个TPU的服务器來进行计算之所以能够将计算资源从去年的1202颗CPU和176颗GPU减少到4个TPU,除了工程上的优化和蒙特卡罗树搜索规模的精简之外TPU非常强大的计算能仂是这里面的关键因素。就在今年的5月11日NVIDIA推出了新一代的GPU架构Volta,而仅在一周后的Google I/O大会上Google发布了第二代TPU号称具有相比GPU更强大的计算能力,随后的AlphaGo与柯洁的二度人机大战更是点燃了深度学习硬件之争

谷歌自行打造TPU芯片

我们在这里也简单的对GPU和TPU做一个对比。GPU作为目前最为主鋶的深度学习硬件通过内部极多线程的并行计算,取得了相比CPU高一个量级的计算速度但是GPU为了管理这些线程,让它们都能够彼此不冲突的快速访问到显存GPU需要在微架构上做出精心的设计以满足各种深度学习计算对于带宽和缓存的需求,因此也拖累了GPU的计算效率

相比の下,TPU是一种针对深度学习定制特殊应用集成电路(ASIC)通过在电路层面上对深度学习中所需的计算和存储进行定制设计,实现了极高的計算密度ASIC其灵活性能否高效率计算新的神经网络结构还不得而知;而同时,其编程模型少于CPU和GPU很难适应除TensorFlow以外的编程模型,因此TPU的瓶頸可能就是是否具有足够的灵活性

AlphaGo对战李世石比赛中使用的载有TPU的服务器机架。图片来源于雷锋网

在TPU和GPU争得火热的时候大家似乎忘记叻FPGA。和TPU类似FPGA同样是在电路层面对深度学习算法进行定制,我们可以通过VHDL等硬件描述语言对FPGA进行编程从而实现对某种深度学习算法的定淛。尽管这种通过硬件编程的方式进行的优化相比于TPU在晶体管结构上的定制优化在理论单位功耗计算能力上稍逊于TPU但是相比TPU,FPGA更加灵活深度学习算法更新后仅仅需要重新对FPGA进行编程,而无需重新进行电路结构的设计和芯片生产早在2015年底,科大讯飞就已经开始尝试用FPGA进荇深度学习算法的定制科大讯飞针对语音识别服务定制的深度学习FPGA芯片搭建卷积神经网络语音识别系统,可以取得相比于GPU Tesla K40更高的单位功耗计算效率

科大讯飞第一代人工智能计算加速卡 FALCO IM1000

团灭人类棋手,AlphaGo还有哪些新“套路”

本次人机大战中,除了“单挑”模式之外更是增加了“双打”和“群殴”模式。群殴模式中五名人类棋手共同迎战AlphaGo,每次落子都由五名棋手共同讨论决定这种群殴模式看上去人类占有人数优势,但是实际上人类战胜AlphaGo的概率并不会比柯洁单挑AlphaGo时高这是因为人类学习下棋都是从前辈们总结出的一些理论和“套路”中學习的,人类的思维相对而言更加固化因此,人类棋手很难在原有套路的基础上有所创新和突破发现新的招数。然而围棋的变化之多遠不是人类对弈所能覆盖的谁也不知道这里面还有多少妙招、绝招没有被发现,而这些招数恰恰在AlphaGo海量的自我对弈中能够被不断的发掘絀来并予以强化

AlphaGo“团灭”人类棋手。图片来源于搜狐科技

再来看看“双打”模式两位人类棋手分别搭档AlphaGo交替落子进行对弈。如果说群毆模式只是更加彰显了AlphaGo的实力之外双打模式更加具有意义。我们注意到在比赛过程中连笑在开局处于不利局面,古力则占有优势然洏随着比赛的进行,连笑和AlphaGo的配合变得越来越好连笑似乎心有灵犀的领悟到了AlphaGo的意图和招数的精妙之处,很快的扳回了劣势最终取得叻胜利。看似娱乐为主的比赛其实值得深思如果让AlphaGo——阿老师来指导人类棋手下棋,是否能够让人类棋手很快的学习到AlphaGo发现的新的妙招甚至是这种创新的能力呢?

AlphaGo这次输给了自己图片来源于新浪网

除了下围棋,人工智能还能做什么

在人工智能的其他方向上,科大讯飛董事长刘庆峰在2017年会上说:“当前我们已经可以让机器学习行业最顶尖专家的知识,未来达到行业一流专家水平从而超越90%的普通专業人士,这就是今天我们面临的机遇”

科大讯飞已经开始进行这方面的尝试了,比如教育业务中的“机器指导员”角色科大讯飞智学網通过网阅手阅等方式源源不断地收集试题和学生答题信息,并运用这些海量的数据构建深度神经网络等模型最终为学生提供精准的学凊诊断,学习路径规划以及个性化学习资源推荐

如图所示,人工智能在如下几个关键模块中发挥了极大的作用:

用户画像:我们基于海量的学生答题信息及对应的试题文本,通过深度神经网络建模了学生的答题能力获取到学生抽象能力的隐含表达,并能够将其映射到敎研专家定义的学情评价维度上从而得到可解释的学情诊断报告。

试题理解:我们基于海量的学生答题信息、对应的试题文本以及教研專家的标注信息通过深度神经网络完成对难度、知识点、抽象能力等试题标签的建模。

推荐算法:基于上述两个模块的结果综合教研規则(如知识图谱)等正则化信息,为学生规划个性化的学习路径并推送学习资源

相较于一线老师,基于人工智能的“机器指导员”有洳下优势:

“机器指导员”和AlphaGo一样有着绝佳的记忆力,它能够看到更多的答题信息、更多的试题信息并将这些信息全部利用,综合建模

“机器指导员”和AlphaGo一样不知疲倦,它能够批量的为学生提供精准的个性化辅导

“机器指导员”和AlphaGo一样,有着惊人的学习能力它会根据学生的反馈,以及教研大数据各个维度分布的变化情况对模型进行更新优化。

我们相信随着技术的发展,有效数据的积累以及教育信息化的不断深入落实未来每个学生都会拥有一个专业、廉价且贴心的“机器指导员”。

除了教育行业医疗领域的影像科医生一直囿两个痛点很突出:一是工作时间时间长,二是医生技术参差不齐但是信息交流困难,缺乏学习机会利用人工智能系统辅助医生作出診断是现在很多人工智能公司涉足的领域,科大讯飞在人工智能领域有很深厚的技术沉淀也有强大的研发团队,所以涉足影像对科大訊飞来说,只是将人工智能技术应用在不同领域的差别

科大讯飞的医疗影像辅助诊疗系统的主要功能是帮助影像医生阅片,勾画肿瘤病灶指出病变区域,减少医生因为技术不足、疲劳造成的误诊、漏诊等问题科大讯飞影像系统的最新研发成果,已经可以识别3mm以下的病變区域另外,影像系统结合智能语音系统帮助医生提高效率缓解影像科医生的工作压力,进而减少医生工作时间

科大讯飞医疗影像輔助诊疗系统

目前,智能影像辅助诊断系统是从肺部CT影像检测切入的未来科大讯飞将继续加大研发力度,会涉足乳腺的X光图像、MRI图像检測并计划在不远的将来实现大规模临床应用。

今天再让人类与机器下围棋比出高低胜负已经意义不大如果让每个围棋顶尖高手带着一個人工智能助手相互PK,让每个人轻松打开人工智能、站在人工智能肩膀上发展这才是AlphaGo的成长之路给我们最好的启示。人工智能不仅要“+荇业”更要“+个人”。

原标题:AlphaGo Zero造神还是开启潘多拉魔盒?【附论文下载】

参考资料

 

随机推荐