从 AlphaGo 说起,DeepMind 官方回顾 2016 年大事纪

从 AlphaGo 说起,DeepMind 官方回顾 2016 年大事纪

这个时代变化多端、複杂多样,我们正在经历气候变迁,也曾忍受新疾病出现。而在智慧系统的说明下,人类会逐渐解开全新技术的面纱,推动社会向更完善的方向发展。在这一过程中,我们需要一个能够从零开始对现阶段不同问题的理解逐渐加深的通用性系统,以此辨识出那些有可能被遗漏的科学突破。这正是 DeepMind 一直以来所关注的焦点。

对于 Google DeepMind ,众人也一直关注着它的研究和进展。在 2017 年开始之际,DeepMind 官方发表文章回顾了 2016 年该公司的大事纪。雷锋网根据原文顺序对每个计画进行编译和适当补充。

在过去一年里,DeepMind 已经在不少领域取得了令人兴奋的进展。

AlphaGo

相信很多人都是因为 AlphaGo 才知道 DeepMind 的。2016 年, AlphaGo 在古老的围棋比赛中以 4:1 的高分击败了世界大师级冠军李世乭,从此一炮而红,并且二度登上《Nature》杂誌封面。许多专家认为,人类至少提前十年完成了这一壮举。对于 DeepMind 以及世界围棋界而言,最激动人心的是 AlphaGo 在博弈过程中所表现出来的创造力,甚至有时候它的招数对古老的围棋智慧都造成了挑战。要知道,一直以来围棋都被认为是最需要人类深思熟虑的游戏之一, AlphaGO 的胜利彰显了人工智慧的巨大可能性。此外,DeepMind 表示 2017 年也将带来更多机器参与人类游戏的研究。

生成模型领域:WaveNet

在生成模型领域,DeepMind 也取得了意义非凡的进展。研发团队在发表了图像生成 PixelCNN 论文之后,又发表了最新原始音讯波形深度生成模型音讯 WaveNet 的研究论文。WaveNets 是一种卷积神经网路,能够类比任意一种人类声音,生成的语音听起来比现存的最优文本(语音系统)更为自然,将类比生成的语音与人类声音之间的差异降低了 50% 以上。这种深度生成模型能够模仿人类的声音,生成的原始音讯品质优于目前 Google 採用的两种最优文本──语音模型 Parameric TTS 与 Concatenative TTS 。由于 WaveNet 不是将录下的语音样本拼接起来,而是创造出的新的音讯波形,所以它很有可能会达到世界上最动听的语音合成。

目前,DeepMind 正计划将这一成果融入穀歌产品中,藉此提升数百万使用者的产品体验。

可微分电脑 DNC

2016 年,DeepMind 在储存(memory)领域也取得不小的进步,尤其是在解决如何将神经网路的智慧决策和複杂结构化资料的储存、推理能力结合起来的难题。实验室团队提出了可微分神经电脑的神经网路模型(Differentiable Neural Computer,简称 DNC)。这种新型模型将神经网路与可读写的外部记忆体结合,既能像神经网路那样透过试错和样本训练进行深度学习,又能像传统电脑一样处理资料。

目前,这些模型已经学会回答有关资料结构(从家谱到地铁交通地图)的问题。DeepMind 表示,这让人类距离使用人工智慧在複杂资料组中进行科学发现又近了一步。

开源 DeepMind Lab

去年 12 月, DeepMind 宣布向大众及其他开发者开放其用于众多实验的迷宫类游戏平台,把训练环境的整个原始程式码发表至开源社群 GitHub,并将其名称由 Labyrinth 更改为 DeepMind Lab。届时,所有开发者都能下载原始程式码并对其进行个性化设置,以此训练和测试原有的 AI 系统。此外,11 月,该公司还宣布了与动视暴雪 ( Activision Blizzard ) 合作的消息,两者将联手把游戏《星海争霸 II 》转换为一个测试平台,以便所有 AI 研究人员都有机会製作出这款複杂游戏的人工智慧系统。

用技术改善医疗

2016 年,DeepMind 与英国国家医疗服务体系 NHS 旗下的基金会 Royal Free London 签订了为期 5 年的合约,目标处理 172 万患者的医疗纪录。同时,DeepMind 还获得了来自伦敦医院的两个资料库,一个是让 AI 软体确定退化性眼病早期徵兆的 100 万张视网膜扫描报告,一个是训练 AI 软体来辨识健康组织和癌变组织的头颈部癌症图像。

DeepMind 希望探索出运用先进技术来改善数百万患者医疗条件的方案,并且透过其开发的行动应用程式和基础设施改进临床护理。

其他

此外,DeepMind 还参与建立了非盈利 AI 合作组织(Partnership on AI), 与 Facebook、亚马逊、IBM、微软等科技巨头一起,在诸如演算法的透明性和安全性等领域探索出最好的实践方式,进而找到用 AI 达到社会利益最大化的方法。

DeepMind 在推动智慧系统运用于现实世界的同时,也关注如何提升自身的学习效率。2016 年,Google 宣布 DeepMind 研发的学习软体已经成功让 Google 资料中心的能耗减少了大约五分之二。据悉,这种软体透过学习资料中心的操作日誌进行压缩,进行大规模的模拟操作,最终达到了过程的优化。

此外,DeepMind 前不久还发表了论文《非监督辅助任务中的强化学习》(”REINFORCEMENT LEARNING WITH UNSUPERVISED AUXILIARY TASKS”),介绍了一种极大提高代理学习速度和最终成效的方法。研究人员透过让代理在训练中执行两个附加任务,对标準的深度强化学习方法进行增强。

结语

DeepMind 是一家在英国的人工智慧公司,成立于 2010 年,它曾经让 Facebook、Google 等科技巨头都为之着迷,最后 Google 在 2014 年 1 月以 2.63 亿美元成功将 DeepMind 收入囊中。

2016 年 3月,AlphaGo 以 4:1 的傲人成绩击败了世界围棋冠军李世乭,自此,其背后的研发者 DeepMind 也开始进入到大众的视野中。

在 2017 年,DeepMind 希望可以进一步在演算法突破、社会影响与最佳道德实践 3 个方面获得进展,继续为整个科学领域乃至世界做出持续、有价值的贡献。