DeepMind是否找到了正确的科学探索方向?
原标题:DeepMind是否找到了正确的科学探索方向?
谷歌母公司Alphabet旗下的DeepMind过去一年损失总额达5.72亿美元。作为全球规模最大的人工智能学术研究机构之一,DeepMind在过去三年中始终亏损,累计金额已超10亿美元。在未来12个月内,DeepMind还需要继续投入超过10亿美元。
这是否意味着AI技术正在走向崩溃?
这不一定。研究活动本来就相当烧钱,与一系列最顶尖的科学项目相比,DeepMind的支出只能算是“九牛一毛”。欧洲的大型强子对撞机项目每年光是维护成本就高达10亿美元,最终发现希格斯玻色子的总成本估计将超过100亿美元。而且,人们印象中的真正人工智能(也被称为人工通用智能,简称AGI)这类既能玩转《星际迷航》、又能听懂人类表达的重量级成果,开出的价码也 不会便宜。
即便如此,DeepMind逐年上升的亏损水平仍然值得关注:2016年,DeepMind亏损额为1.54亿美元;2017年增长至3.41亿美元;2018年则进一步提升至5.72亿美元。在笔者看来,这其中包含着三大核心问题:
DeepMind是否找到了正确的科学探索方向?
从Alphabet的角度来看,这样的投入规模是否合理?
如此可观的亏损数字,又会给整个AI市场带来怎样的影响?
首先来看探索方向的问题。之所以值得讨论,是因为DeepMind明显是把鸡蛋都放进了同一个篮子——也就是深度强化学习。这项技术主要用于通过模型识别将深度学习与强化学习加以结合,基于奖励信号实现学习能力,从而使系统学会如何在游戏中获得更高分数、或者在象棋等游戏中对抗求胜。
DeepMind的成名之作是2013年发表的一篇论文。这篇令人振奋的成果阐述了如何对单一神经网络系统进行训练,以教会其游玩多款雅达利游戏(包括〈突围〉以及〈太空入侵者〉),并最终获得近似甚至超越人类的成绩。这篇论文让DeepMind成了AI领域的摇滚 ,并成功引起谷歌方面的注意。在2014年1月被谷歌收购之后,DeepMind进一步推动技术开发,先后在围棋以及不朽神作《星际争霸》游戏中接连取得胜利。
但问题在于,这项技术对环境有着非常具体甚至可以说是苛刻的要求。例如在游玩《突围》时,哪怕是一丁点微小的变化,例如将镜头对焦位置移动几个像素点,其性能都会受到巨大影响。DeepMind的《星际争霸》系统同样局限性明显:在同一地图内使用同一种族进行对战,其成功确实足以超越人类;但在其它地图使用另一种族时,成绩就会快速下滑。要转换作战风格,我们必须从头开始重新进行系统训练。
从某种程度上讲,深度强化学习是一种经过增强的记忆系统;它在某些场景中确实拥有良好表现,但对工作内容的理解程度却非常有限。因此,这类系统没什么灵活性可言,无法即时根据环境变化做出调整,并最终导致极微小的变化都会显著影响实际性能。(DeepMind最近公布的肾病检查方案,也因为类似的问题而遭到质疑。)
深度强化学习同时需要大量数据作为支持——例如在学习围棋时,需要完成数百万盘自我对局才能掌握个人奥妙。很明显,人类棋手不需要也不可能完成如此庞大的训练量,而且这样的过程难度极高且成本极巨,只有谷歌这样的科技巨头才能负担得起恐怖的计算资源需求。换言之,绝大多数企业与客户根本不可能在自己孱弱的独立计算机上实现类似的现实问题解决能力。根据估算,AphaGo的整个训练周期耗资达3500万美元,其消耗的能量足以支持12760个人连续三天不停进行脑力劳动。
以上讨论的只是经济问题。更重要的是,正如Ernest Davis和笔者在即将出版的《Robboting AI》一书中提到,我们能否信任现有AI方案。目前,深度强化学习只能在良好可控的环境下提供可靠的结果;这样的局限对于围棋这种两千年来没怎么发生变化的场景非常适用,但我们显然不敢贸然把它引入到其它现实问题当中。
>>> 难以实现商业应用
之所以难以商业应用,主要是因为目前大多数实际问题都不像游戏那样拥有严格的场景与条件。也正因为如此,DeepMind目前仍拿不出比较像样的深度强化学习商业方案。与此同时,Alphabet已经在DeepMind身上烧掉了约20亿美元(包括2014年收购DeepMind的6.5亿美元)。但除了赚到的好名声之外,DeepMind在过去一年中只带来了约1.25亿美元的实际收入,其中相当一部分为Alphabet内部利用深度强化学习技术降低冷却成本省下的电费。
而且在围棋领域大显身手的技能,也很难解决其它挑战性问题——例如癌症与清洁能源。这类状况早已有之:IBM公司的Watson曾在问答节目当中一鸣惊人,但却一直无法成功进军医学诊断领域。虽能够在某些病例中提供良好表现,但Watson在另一些病例中却惨遭失败,甚至还曾经在心脏病发作症状的判断上犯错——要知道,这可是医学新生都能准确判断的病症。
当然,时间也许能够解决这个难题。至少自2013年以来,DeepMind就一直在努力研究深度强化学习技术,而且科技进步也向来难以快速转化为实际产品。DeepMind以及其它研究机构,最终也许能够找到一种可行的方式,促进深度强化学习带来更稳定也更契合任务内容的结果;又或者,这项技术未来能够与其它技术结合起来,迸发出新的能量。也许深度强化学习最终能够像当年的晶体管一样,成为一种彻底改变世界的实验室发明,也有可能永远停留在探索阶段,仅仅作为人类不断探索真理的道路上的又一块铺路石。但无论如何,笔者个人猜测最终结果可能介于这两者之间——有用而且广泛存在,但又不足以改变整个世界。
虽然DeepMind目前的成果没能完全符合人们的期待,相信也不会有人对其妄加指摘。深度强化学习不一定是通往人工通用智能的正确道路,但这丝毫不妨碍DeepMind自身的伟大——这仍是一个运营严密、资金充裕而且人才济济的机构。而且如果网接下来AI的发展方向有所变化,DeepMind也一定会是能够迅速抓住机会的参与者之一。就目前来看,能够与DeepMind相抗衡的研究机构仍然屈指可数。与此同时,Alphabet也是一家财力雄厚的企业,对他们来说一年5亿美元也不是啥大问题。Alphabet公司曾非常英明地决定投资AI技术,其中包括目前同样在快速成长的Google Brain项目。Alphabet方面可能会通过多种途径调整自家AI方案的组合方式,不过考虑到这是一家年收入高达1000亿美元的行业巨头,而且旗下搜索服务及广告推荐等大部分业务都依赖于AI技术,相信他们有能力也有理由继续支持这些重量级研发项目。
>>> 过度炒作难题
关于最后一个问题,我们目前还很难判断DeepMind的经济状况会给整个AI市场带来怎样的影响。如果交付的成果完全跟不上当初的炒作宣传,那么“人工智能寒冬”也许终将来临,甚至导致原本的支持者失去信心而停止投入。另外,如果DeepMind在未来几年中的亏损额继续一路飙升,恐怕Alphabet自己也有可能被迫退出。毕竟到目前为止,DeepMind还是拿不出像样的财报数据,时间久了投资者难免要重新思考自己对于AI技术抱持的立场。
同样麻烦缠身的,远不只是DeepMind。无论是无人驾驶汽车还是能够顺畅理解人类语言的聊天机器人,这些几年前被炒得火热的概念至今仍然没有实现。Mark Zuckerberg在2018年4月的美国国会听证会上曾保证,虚假新闻问题很快就会在AI技术面前土崩瓦解。但是情况显然没这么简单,这也使得整个社会对于AI技术的看法变得愈发保守——不信 ,信“疗效”。
至少就当下看,人工通用智能还只是个目标,距离真正落地还有很长的路。虽然AI技术在广告及语音识别等一部分领域取得良好进展,但必须承认,AI发展还远称不上成熟。但在另一方面,我们也要认可AI在大数据分析领域的强大能力;而且哪怕只是当前的水平,AI也已经是一种卓越的技术工具。因此即使未来企业不再倾力投入,AI的研究与发展也 不会沉寂下去。
>>> 预测未来
在笔者看来,十年之后我们可能会得出结论,发现深度强化学习的意义其实被高估了。这也使得其它不少真正重要的研究方向遭到忽视。毕竟在强化学习领域投入的第一块钱,都代表着其它研发经费的缩减——例如对于人类认知科学的研究。当下,很多机器学习研究人员都在问,“机器如何利用大量数据优化复杂问题?”但我们真正应该关心的,其实是“为什么孩子们用不着那么多数据和那么复杂的处理流程,就能掌握自然语言并理解现实世界?”如果我们能在后一个问题上多花点时间、资金和精力,也许人工通用智能的来临还能更早一些。