Tag: deepmind

  • DeepMind这几年

    DeepMind最近又搞了个大新闻,所以我觉得应该根据能看到的资料,为大家稍微介绍一下这家我个人认为十分了不起的公司。

    创始人和公司简介

    创始人之一是Demis Hassabis(1976/07/27——),就是下面这位老兄:

    DH应该是属于天才这样的人物,他从小开始学习编程。16岁的时候开始为Bullfrog公司工作,开发了“主题公园”这款游戏。他自己也是一位国际象棋好手。

    DeepMind公司由他和另外两位联合创始人一起在2010年成立。2014年公司被Google收购,2015年成为Google母公司Alphabet Inc下的全资子公司。

    公司的重要作品

    2016年

    2016年,DeepMind公司开始为人所知,因为在那一年,公司开发的AlphaGo在围棋正式比赛中击败了当时的世界顶尖选手李世石。五番棋的结果是4-1。

    长久以来,围棋一直被认为是最不可能由“机器”来下出真正顶级水平的智力运动。AlphaGo之前,一些围棋机器人大概也只有业余几段的水平,根本不能和职业选手相对抗。

    但AlphaGo横空出世,彻底颠覆了人类的成见。我承认,我当时是希望李世石能击败AlphaGo的。

    2017年

    2017年,AlphaGo又在3局比赛中击败了柯洁。

    此时的引擎还是要依靠学习人类的比赛和经验(比如开局指南等)来获得“经验”。

    2017年,AlphaGo的升级版出现,可以与人类顶级高手进行全对称信息对弈类游戏的竞争。这个升级版被命名为AlphaZero,可以进行国际象棋、围棋和日本将棋的对弈。

    更令人震惊的是,这个版本完全是通过自我学习而在短时间内达到了人类难以企及的水平。AlphaZero的前一版本AlphaGo Zero只自学了3天,而且用了更加少的计算量,就在一次内部比赛中以100:0的可怕优势击败了AlphaGo。

    AlphaGo Decision Tree

    另外值得一提的是,这一年也可以说是国际象棋引擎的爆发之年。在AlphaGo的激励下,全球出现了众多水平也极高的国际象棋引擎,如Stockfish, LeelaChess Zero, Komodo等等等等。

    如今的国际象棋人类选手,已经习惯于用引擎来帮助自己训练。一旦在对弈中下出令职业选手都叹为观止的下法,人们也习惯用“Engine Move”来形容这一手。

    2018年

    这一年,基于DeepMind之前的研究,Google推出了第一个商用TTS产品:Cloud Text-to-Speech。它基于DeepMind的WaveNet项目。

    2019年

    这一年1月,DeepMind推出了AlphaStar,用来与人类高手进行星际争霸 II的对决。经过不断改进和限制“作弊”1的举动,在这一年10月,AlphaStar已经在三个星际II种族的天梯比赛中,都达到了大师级别。

    星际争霸和围棋、国际象棋不同,它是非对称信息的对战:你知道自己的兵力、科技树,但不可能完全知道对手的兵力、科技树;换句话说,对方在某种程度上是“隐形”的。

    2020年

    2020年的14届CASP会议上,DeepMind推出了AlphaFold,一个专注于蛋白质折叠的引擎。在43个蛋白质中,它最精确地预测出了其中25个蛋白质的空间折叠结构,达到了“实验室”精度。

    AlphaFold

    蛋白质的空间折叠具有重要的现实应用价值。蛋白质只有在折叠成一个特定的空间结构时,才具有其作用;如果折叠后的结构不对,就会出问题,而且是涉及生命体健康的大问题!

    如果我们能在AlphaFold的帮助下,快速、准确、低价地预测出蛋白质的空间结构,那必将大大造福于人类。

    2021年

    将近沉寂一年后,DeepMind又抛出了一个重磅新闻。4天前(2021年12月1日)的《自然》杂志上刊登了一篇文章,题为“DeepMind’s AI helps untangle the mathematics of knots”。

    我认为,这次的DeepMind开始展现出真正的“人类”思考模式:从众多已知的现象中,开始进行归纳,并历史性地为人类提供思路:它一次性提出了两个数学猜想:一个涉及纽结的几何特征和代数特征之间的关联;一个涉及表示论。

    搜狐的这篇报道说得很对:

    首先我们要知道,证伪一个猜想相对简单,只需要找出一个反例即可。 但从零开始提出一个全新猜想这种工作,AI还是 首次参与进来。

    人类的直觉(以及由此而来的归纳、演绎、推理)一直以来都是AI的难点,DeepMind跳出了之前(无论是全对称信息还是非全对称信息)游戏中还存在的由(卑微的)“人类”设置的规则,开始为人类发现、制定规则。这真的是“不明觉厉,细思恐极”的一步。

    这才是人工智能的正确方向。


    1. 一开始,AlphaStar是能马上看到全部地图的,但人类选手不行而必须通过“探路”、“侦察”才能逐步“点亮”地图。这个bug给引擎带来太大的优势,因此在后续的改进版本中,这个不合理的”作弊“行为被修正了。 

  • This is Game Changer, this is real AI

    《Game Changer》是一本关于国际象棋目前最强的引擎AlphaZero的书。

    根据推算,AlphaZero的等级分在3480分左右;而目前的国际象棋男子世界冠军马格努斯·卡尔森(Magnus Carlsen)的等级分也不过在2860分上下。也就是说,AlphaZero可以轻松吊打卡尔森。

    这本书目前国内还没法买到,也没有翻译。好朋友Vera帮我下单并顺便买单,她实在是一个好人!

    我曾试着和出版社联系,但他们听到这是一本关于国际象棋的书后,就表示很难出版——毕竟说来,虽然人工智能这个话题很热门,但国际象棋这个话题太冷门了。

    我国际象棋水平不高,但是很喜欢下。它能运动的子力以及子力的运动范围和作用都比中国象棋大了很多,所以其变化也就更加多样。

    国际象棋的AI(或者说人机大战)出现得很早。我们都熟知深蓝和卡斯帕罗夫的对战。自此之后,其实国际象棋引擎已经树立了全面超越人类棋手的地位:顶尖的人类棋手已经无法打败一个顶尖的国际象棋引擎

    那么,既然如此,DeepMind的各位老兄为什么还要钻到国际象棋引擎里来?

    我们必须知道一点,在AlphaZero出现之前,所有的顶级国际象棋引擎(乃至包括围棋引擎)都有一个共同点:有关该领域的人类知识的基础

    比如说,国际象棋引擎会被人教导说:开局一般不要重复走一个子(特别是大子)、叠兵一般是不好的、能易位就要尽量易位、双象一般比双马或者马象的结合要好等等……然后,也会被人教导说:后值9分,车是5分,马象是3分,兵是1分……;还有诸如开放线、通路兵之类的“价值”;甚至还有开局手册、终局指南等等。围棋引擎也是如此。

    但是:

    1. AlphaZero的学习不依靠任何与该领域(国际象棋)相关的或者人类的知识
    2. AlphaZero对局面的判定是或然性的(基于它认为赢或者平的机会多大)而不是以领先多少兵来判定——而这是当时所有引擎的判定方式。
    3. AlphaZero搜索它认为最有前途的走法,它的评估是多个可能序列的平均而不是试图找到单一的最佳路线。
    4. AlphaZero的评估函数结构非常灵活并允许它考虑位置因素的组合。

    这是和所有引擎都不同的地方。

    AlphaZero横空出世,在经过4个小时的训练后,DeepMind认为它已经超过了当时最强的引擎Stockfish 8的等级分,在训练了9个小时后,它和Stockfish 进行了100盘的对战,最终取得了压倒性的胜利:28胜,72平,0负。这100盘棋的棋谱得以公开,也正是本书分析的重点。

    作者通过分析这100局对战,总结出了很多AlphaZero的“风格”,比如:它倾向于瞄准对方的王;让自己的王安全;在削弱自己的王翼结构以打开进攻路线前,它会确保中心局势稳定等等等等。这些都是所谓的“后知”分析,是人类根据AlphaZero的下法得出的结论,并不是说AlphaZero“知道”这样下比较好——它根本不知道。它只知道如此这般的下法可以让自己有更多的赢棋机会。

    如今的国际象棋高手都已经习惯于通过某个引擎甚至多个引擎来帮助自己提高。AlphaZero的一些下法完全颠覆了人类多年来的固有下法和定式。这对国际象棋本身的发展是具有革命性意义的。棋手通过向“机器”学习,拓展自己的思路和对国际象棋的理解。国际象棋界甚至专门创造了一个术语“Engine Move”来特指那些几乎无法由人类棋手想到、但顶级引擎一定能想到的“神之一手”。

    DeepMind很有野心,他们是想将AlphaZero做成一个通用的引擎,可以用来下国际象棋(西方主流)、围棋(中国主流)以及将棋(日本主流)。不过,AlphaZero也有局限:它只能进行目标明确、双方对弈、信息全对称的游戏,而如炉石、星际争霸之类的信息非对称游戏下,它就无能为力了。

    这才是AI的正确的发展姿势。

    DeepMind公司并没有停步,就在今天我看到一条爆炸性新闻:他们公司的AlphaFold 2在所谓的CASP14蛋白质折叠竞赛中,拿到了接近90分的高分。

    这才是AI的正确的发展姿势。

    确定蛋白质的空间结构到底有多大的意义,我就不说了。有兴趣的可以自行搜索。

    我总是忍不住地想,只要人类中还有这样的科学家,人类发展的前景就将是美妙的。