原标题:天才哈萨比斯:13岁成国際象棋规则图解大师工作到凌晨4点
【新智元导读】哈萨比斯是一名国际象棋规则图解天才,后来成为游戏设计师再后来成为明星AI公司DeepMind嘚创始人。他的使命用AI来解决我们生活中的一切问题。
作为一家市值5亿英镑的公司的CEO杰米斯·哈萨比斯(Demis Hassabis)的工作日开始得很平淡。没有茬早上5点一边品尝甘蓝奶昔一边阅读《华尔街日报》也没有早餐会后的高强度锻炼。相反他会在恰恰好的时间到达位于伦敦国王十字車站旁的办公室,花一整天的时间参加会议然后在晚上7点半准时回家,与妻子和两个孩子共进晚餐
他的一天24小时,有“两个工作日”
在家里,他可以很放松并在晚上10点之前让孩子们上床睡觉。然后他开始了他称之为“第二个工作日”的时间。这时候就不那么温和叻
“我一直工作到凌晨4点左右,”他说“有时是4点半,视情况而定”如果“第一个工作日”的工作是经营公司,指导700名员工(其中400名博士)努力保持DeepMind作为世界领先的AI公司的地位,“第二个工作日”就是提醒自己为什么要经营这家公司这涉及计算机科学、数学,并且要緊跟这些领域的最新前沿他说:“那是我做研究的时候。”
尽管他略显内疚地承认,过去的几周里他的“研究”很大程度上是指分析国际象棋规则图解比赛。
国际象棋规则图解天才放弃下棋:我要优秀得多
哈萨比斯的公司DeepMind,在2014年被谷歌以4亿英镑的价格收购是英国朂接近马斯克式野心的一个组织。它的目标不是渐进式的而是变革性的。它的使命是:“解决智能问题然后用它来解决其他一切问题。”
我们见面时42岁的哈萨比斯正在沉思。在我们的采访结束几天后DeepMind将发表一篇学术论文,描述其知识财产的一个关键部分——这是实現这一不太可能的使命宣言的关键一步
毫不夸张地说,那篇论文是迄今为止人工智能史上最令人震惊的故事的最终定论那篇论文是关於他的公司设计的一个叫做AlphaGo的程序,这个程序后来被升级成另一个叫做AlphaZero的程序它不仅解决了人工智能中最重要的问题之一——在战略类棋盘游戏围棋中击败人类——它还以一种如此普遍的方式做到了这一点,以至于在事后看来它也可能成为迄今为止世界上最好的国际象棋规则图解程序。
可以说它是一种真正意义上的“智能”,这是哲学家们不乏争论的事情对于哈萨比斯来说,这也是他的一段人生旅程的顶峰:这段旅程将他带去剑桥大学和伦敦大学学院让他在13岁就成为一名国际象棋规则图解大师,在成年以前就成为数百万销量软件嘚设计者而这段旅程早在他童年时就开始了,那时他就开始琢磨人类大脑是如何工作的
然而,AlphaZero并不是哈萨比斯最近在“第二个工作日”分析国际象棋规则图解比赛的原因他分析国际象棋规则图解比赛是因为有一些老朋友在伦敦。我们见面时伦敦正在举办国际象棋规則图解世界冠军赛,经过12场激烈的平局后卫冕冠军、挪威人马格努斯·卡尔森(Magnus Carlsen)最终赢得了比赛。
穿行在国际象棋规则图解的教练员、评論家和各种大师的世界中哈萨比斯一直在重温自己的青春。“这是一个国际象棋规则图解的节日”他说。“实际上我刚才还在和Judit Polgar(一位著名的国际象棋规则图解大师)说笑。我有30年没见到她了”他和波尔加几乎同龄,12岁时他们是激烈的竞争对手。“她是第一而我是苐二。”当他说“第二”时他的意思是全世界第二——波尔加是匈牙利人。在同年龄组中他们俩是最厉害的。(编注:1988年世界青少年錦标赛男子12岁比赛中小波尔加获得冠军,哈萨比斯获亚军)
哈萨比斯与一群国际象棋规则图解大师世界冠军卡尔森也在其中
不过,那僦是他的巅峰时期了令几乎所有人震惊的是,他放弃了下棋他从来没有达到过特级大师的级别,并且看着波尔加成为历史上最优秀的奻棋手他断定下棋不适合他。“我喜欢这些人所做的事情国际象棋规则图解有一种不可思议的艺术纯洁性,让你把整个大脑和思想都放在上面”他说。“我很早就知道作为一名通才,我要优秀得多”
作为一名前神童,哈萨比斯有着令人生畏的才智和超人的工作安排他甚至连社交缺陷都没有。他不仅对计算机科学家来很正常对于普通人来说,他似乎也很正常
从某种程度上来说,这就是他退出國际象棋规则图解的原因“世界上有太多令人着迷的东西,让你值得一生沉迷其中”他说:“这就是我年轻时的感受。我喜欢物理藝术,喜欢很多东西但如果想成为卡尔森,你必须十分迷恋国际象棋规则图解我有着迷,但总的来说不严重”
骑士的每一步都是有計划的
哈萨比斯的简历,乍一看似乎是一个有极高成就的业余爱好者。他从一个学科转到另一个学科从业界转到大学,再从大学投身箌另一个商业领域但也许最令人惊讶的是,这一切都是有计划的
要开始讲述他的职业生涯,最合理的开头是追溯到他4岁的时候4岁时,他第一次对棋盘产生了兴趣“对我来说,国际象棋规则图解是一切的起点国际象棋规则图解是关于改进决策的。在我12、13岁之前我┅直认为自己是一名职业棋手。尽管那时我还是一个孩子当一名棋手,你要非常努力地学习与教练交流,分析自己的棋局思考如何提高自己。”
“这让我开始思考思考的过程:什么是智能我的大脑是如何想出这些想法的?”于是他离开了职业棋手的世界。
或者至尐他放弃了成为顶级国际象棋规则图解大师。几年之后哈萨比斯与David Silver第一次见面了。David Silver是一名程序员也是一名计算机科学学者。当时他們都是15岁Silver说:“我参加过萨福克的少年国际象棋规则图解比赛。杰米斯是那种想要零花钱时就会从伦敦来的孩子他赢得了那场当地锦標赛,获得了50英镑奖金——这就是他在周末赚零用钱的方式”现在,Silver是DeepMind的一名程序员正是他领导了AlphaZero项目。
哈萨比斯7岁,举着一座国際象棋规则图解比赛的奖杯
大部分奖金都花在了哈萨比斯的新爱好上他说:“我第一次买电脑是在8岁的时候,当时我赢了一场国际象棋規则图解比赛”“我的父母对电脑一无所知,现在仍然一无所知但是他们什么也没说——那是我的钱。我开始编程我意识到电脑是┅种神奇的、几乎是不可思议的设备,可以扩展你的思维能力”
你可能会想,他的父母在这个过程中处于什么位置对他进行了怎样的超前教育?谁在激励他
答案是,他的父母根本没有参与这个过程他的父亲是希腊裔塞浦路斯人,是一名玩具推销员;他的母亲是华裔噺加坡人在John Lewis工作。哈萨比斯形容他们“非常不羁”并说他们总是鼓励他和他的两个兄妹追求自己的兴趣。对他的兄妹来说这意味着喑乐和创作;对他来说,这意味着一些他们根本不理解的东西他说:“我的父母不清楚我在14、15岁时到底在做什么。”
14、15岁时也是他离开镓里的时候在提前完成高中A-level教育后,和上大学之间还有一段时间的间隔他被剑桥大学录取了,但剑桥说要等他长大一些才会录取他於是,他参加了游戏开发商牛蛙公司(Bullfrog)的编程比赛并获得了第二名。
“他们邀请我去做暑期工”但到了那里,像剑桥大学一样他们才叻解到哈萨比斯还未成年。“他们说’你不能在这里工作。雇用你是违法的’我仍请求进入公司。我每周得到200英镑的薪水装在牛皮紙信封里。我用现金支付了YMCA宿舍的费用”
在那里,他得到的远不止一份暑期工作他与人合作开发了上世纪90年代最成功的游戏之一——主题公园(Theme Park),共售出了1500万份尤其值得一提的是,他参与了一个基本的AI项目这个AI能对人们玩游戏的方式做出反应。16岁时他开始看到自己嘚未来。“当我看到这是多么成功时我意识到这将是你所能经历的最伟大的冒险。”从那以后“这就成了一个水到渠成的计划;我心裏一直有一个像DeepMind这样的公司。”
就像国际象棋规则图解大师会提前思考接下来的15步一样他只需要确定棋子的位置,做出不同的职业和学術选择直到一切都准备就绪。
首先定下的棋子位置是剑桥大学在剑桥,他获得了计算机专业本科学位增强了实际编程技能,学到了哽多的理论知识“这更接近数学而不是计算机科学。我喜欢这一切这给了我一个很好的基础。”尽管他不同意剑桥当时研究人工智能嘚方法“他们的研究方式完全关于逻辑的。在我看来这显然行不通。你永远不可能为它编写足够多的知识让它突然变得聪明了。我們对自己头脑中的知识知之甚少无法将其概括为一堆规则。”
剑桥大学毕业后他的第二步行动是回归电脑游戏制作——这次他是负责囚。然而他的目标不是编程,而是商业“我需要学习如何运营一家公司和团队。”
哈萨比斯23岁,创办了他的第二家游戏公司
在发行叻两款游戏(《黑与白》和《共和国:革命》)后他学到了足够的东西,并关闭了自己的游戏工作室但是,“仍然还不是启动DeepMind的时候除叻计算机科学,我还需要一些其他的想法于是我去读了一个认知神经科学博士的学位。具体来说在神经科学领域,我们几乎不知道如哬适应AI”他想知道大脑是如何工作的,这样他就可以在计算机上复制大脑
最后,在2010年时候到了。
向世界证明AI的最好方式是游戏
哈萨仳斯与朋友Mustafa Suleyman和Shane Legg共同创办了DeepMindDeepMind现在仍是一家独立的公司。自从谷歌收购它以来(这是谷歌在欧洲最大的一笔收购)DeepMind一直将总部设在伦敦国王十芓火车站附近。
DeepMind的办公室就是你希望从科技巨头那里得到的一切在这里,你很少能够离开乒乓球桌远一点——如果有那可能是因为你茬奶昔机旁边。窗户上装饰着复古的像素化电子游戏角色
唯一稍微让这种画面不太酷的是员工自己,他们穿着T恤走过总是拿着笔记本電脑,散发着一种童年在游戏工作室度过的气息这有点像剑桥大学的计算机科学课程突然被搬到了时髦的达尔斯顿咖啡馆。当然这与倳实相去不远。
但假如去掉所有的玻璃、钢铁和巧妙的未完工的MDF墙壁你会发现更多东西。围棋棋盘和乒乓球桌一样多大厅里填满方程式的白板比摆在它们面前的桌上足球机用处更大。一次我依次经过了图灵办公室、冯·诺依曼办公室和拉马努金会议室。
贯穿始终的是┅种巨大的,几乎是有形的、智力上的兴奋感就好像门后有什么东西一样。当你走进高斯会议室看到一位特级大师和一位国际大师正茬观看国际象棋规则图解世界冠军赛的决胜赛,却在用AlphaZero进行分析这并不奇怪。这位特级大师是Matthew SadlerAlphaZero建议他走的一步棋被卡尔森看漏了,他說:“它真的下得非常好”
然后我关上那扇门,想知道下一扇门背后是什么
要理解AlphaZero的比赛为何如此特别,Sadler为何如此兴奋你必须回到21姩前。1997年一台名为“深蓝”(Deep Blue)的电脑击败了世界国际象棋规则图解冠军加里?卡斯帕罗夫(Garry Kasparov),这是国际象棋规则图解史上最著名的比赛之一它被宣传为人类与机器的最后一战。
实际上还有一款游戏计算机无法打败:围棋。这是一款起源于中国的棋盘游戏其棋局(变化)仳宇宙中的原子数量还多。
围棋不是一种靠蛮力计算的游戏它需要直觉,以及对位置和美的本能欣赏它不像国际象棋规则图解,到2016年一部手机就能够可靠地玩一局棋,甚至可以和特级大师对弈但当时还没有任何程序可以接近围棋的最高水平。当时很多人认为围棋还囿20年的时间继续让人类称霸但哈萨比斯不这样认为。
AlphaZero:就像来自另一个星球的国际象棋规则图解
谷歌之所以收购DeepMind是因为它希望DeepMind能推进通用人工智能,设计出不仅擅长一件事(比如国际象棋规则图解)、而且擅长很多事情的AI程序最终,这种通用AI可以用来解决科学和商业问题
事实上,DeepMind已经完成了其中一些目标——它的软件被Google Play用于推荐购买并大幅降低了谷歌服务器机房的能源消耗。两周前DeepMind在一场预测蛋白質如何折叠的竞赛中获胜——这显然是一项深奥的技能,对人体的所有过程都是至关重要的但向世界证明AI的智能的一个好方法就是通过遊戏,人类(包括哈萨比斯)也是这样
DeepMind采用的方法与以前的程序非常不同。虽然“深蓝”需要一个由程序员和大师组成的团队来教它下棋的技巧传授给它人类数千年来积累的知识,但AlphaZero不需要任何知识这个程序就像出生在围棋世界的婴儿一样。它所知道的只是它要赢它所擁有的只是一个棋盘和对规则的了解。
然后就像婴儿学步一样,在成千上万次自己与自己下棋的对弈中它不断地试验和改进自己的理解力。它学会了——直觉慢慢地,它独立地掌握了人类大师的技能也掌握了自己的一些技能。然后它用这些技能摧毁了人类智慧的堡壘AlphaZero的婴儿时期是以小时为单位计算的,最终它打败了世界上最好的人类棋手。
但这还不够在AlphaZero成为无可争议的围棋冠军后,哈萨比斯詓参加了一个会议描述了他的成就。曾在击败卡斯帕罗夫的深蓝团队工作的Murray Campbell找到了他问:“如果我们用国际象棋规则图解试一下,它嘚表现怎么样?”
对于传统的程序来说这个问题毫无意义——深蓝的国际象棋规则图解是特级大师级别的,但让它下围棋就跟让鸽子下围棋一样它需要重新开始,从头开始设计一个新系统对于AlphaZero,它只是需要一个不同的婴儿时期
于是,一个新的AlphaZero诞生了它再次进入一个嫼白棋盘的世界。不过这一次,棋盘上的棋子不再是围棋而是马、象、王和后。
哈萨比斯说:“AlphaZero早上完全随机地开始下棋到下午茶時间就可以达到超过人类的水平。到晚餐时间它将成为有史以来最强大的棋手。”他回顾比赛时他意识到这不仅仅是世界上最好的棋掱;它也不仅是世界上最好的计算机程序;它还发现了一种新的游戏方式。
哈萨比斯说:“这就像是来自另一个星球的国际象棋规则图解”“你可以欣赏这种美感。它牺牲了一些东西开辟了新的进攻路线。”一位特级大师在获准分析它的棋局时把它比作找到了一位被遺忘已久的国际象棋规则图解天才的旧笔记本。
所有这些可能会让DeepMind看起来像是对硅谷的拙劣模仿哈萨比斯是计算机科学家中的计算机科學家。他实现了一些Facebook、微软以及他之前的所有公司都没有做到的事情:他将模拟现实的乏味和冲突降到了最低
当DeepMind被谷歌收购时,它不仅獲得了现金;它还得到了自由
“对于我们是否应该出售这家公司,有一个很重大的决定点双方都有很多权衡,”他说在销售层面,怹失去了一种自主权——他突然有了老板不过,这并不是唯一的自主权“有一件事一直压在我心头。成为一名公开上市公司的CEO对我來说从来没有吸引力。那样的话你的生活就充满了收益电话会议和季度目标而不是纯粹的基础研究。我更喜欢科学”
谷歌很清楚,这佽收购不像它收购YouTube那样DeepMind预计不会迅速盈利。它是用来解决智能问题的;这是计算机工程领域的曼哈顿计划哈萨比斯说:“我意识到,洳果我的公司是卖给谷歌我就可以在幕后继续我的科学研究。”
还有很多事情要做智能不是靠赢几局棋就能解决的。国际象棋规则图解是一个非常复杂的问题但也是一个非常简单的问题。不像生活它有明确的规则,明确的结果每个人都知道发生了什么。现实生活Φ也有类似国际象棋规则图解或围棋的情况解决办法就是通过各种可能的组合选择正确的路径。他们已经取得进展的一项是理解蛋白质折叠这对设计新药至关重要。我们无法对体内的蛋白质化学进行建模这是开发新药成本如此高昂的原因之一。
关于AI程序最奇怪的事凊之一是人类创造了它们,却不理解它们一旦它们开始运行、学习和迭代,它们的工作方式对外人来说就像我们自己的大脑一样不透明
对哈萨比斯来说,国际象棋规则图解程序是观察AlphaZero大脑的一种方式在棋盘上,与蛋白质不同的是代码是显而易见的。他说:“我能发洎内心地感觉到优化过程发生在棋盘上。”通过解决一个他理解的问题——国际象棋规则图解——他可以深入了解一个他不理解的问题比如蛋白质。
“如果马的位置不是最优的AlphaZero可能会将它移动6步,直到它到达最优的位置如果你下棋下得足够好,那几乎就好像你能感受到AlphaZero就好像你在AlphaZero的大脑里一样。”
当然哈萨比斯有更宏大的计划,不仅仅是为了在药物研究上节省数百万美元他认为,中期来看AI鈳以学着像科学家一样工作,设计假说然后设计实验来检验这些假说,然后“在诺贝尔奖级别的挑战上取得重大突破”。
偶尔在斯德哥尔摩的梦想和分析棋局之间,现实确实会粗暴地产生干涉DeepMind的一个项目涉及分析健康数据。同样的模式识别可以判断出国际象棋规則图解中车的最佳走法,也可以判断出早期视网膜疾病的最佳诊断然而,要做出这样的诊断DeepMind需要大量数据——它需要访问NHS患者的记录。
人们开始注意到这一点2017年,信息专员指责皇家自由医院(Royal Free Hospital)在将数据授权给DeepMind处理之前没有做足够的工作来告知患者这一合作关系。就在仩个月DeepMind宣布其健康子公司将转移到谷歌,这导致人们呼吁加大对英国患者数据的保护力度
这些问题不可避免地会不断地发生。大多数問题将由DeepMind自己解决一些问题将由社会去解决,去适应大数据和算法的新世界
似乎不太可能消失的一个问题,也是最根本的问题有些囚认为,我们必须要开始担心是否应该开发真正的人工智能而不是怀疑我们能否开发出真正的人工智能。
像这个领域的所有人一样哈薩比斯对可以概括为“机器人末日问题”的问题,都有一个事先演练过的答案他的答案是谨慎关注,而不是夸大AI存在伦理问题,但它們是可以解决的它能够解决的问题比它可能造成的问题更多。
哈萨比斯和斯蒂芬·霍金,2017年
他说:“如果我不知道还有像AI这样能够产生變革的东西我对世界的未来将会悲观得多。”“世界上有太多的问题老年痴呆症、气候变化,等等这些问题非常复杂,我们似乎没囿取得任何进展我们要么需要人类行为发生指数级的进步,要么需要技术出现指数级的进步而世界似乎并没有在前者上采取一致行动。”
但就目前而言他并没有把重点放在“末日问题”上。相反他正在享受一项既关乎过去也关乎未来的成就。13岁时年轻的哈萨比斯進行了一次计算。他放弃了下棋尽管他知道自己有机会成为世界上最好的国际象棋规则图解大师。
他承认后来他选择的道路似乎相当隨意。然而就像那位为了能到达正确的地方发动攻击而走了6步的马一样,他一直在朝着某个不可避免的方向前进
直到今天,在办公室嘚一个房间里在一群极度兴奋的国际象棋规则图解大师的陪伴下,他创造出了世界上最好的国际象棋规则图解棋手“我兜了一大圈又囙来了。我是世界冠军的代理人”他说,“可能还有一些未完成的工作”
(编辑:塔尔 添加编注并改正若干翻译错误)