机构入驻 - 联系我们
您的当前位置: 首页 > 天下奇闻 > 科学探索 正文

当前的上下文方案,本质是暴力破解!DeepMind 创始人:忽强忽弱的 AI,才是真正的灾难,突破在记忆系统

作者:eric 时间:2026-04-14
导读:整理|冬梅 在人工智能狂飙突进的当下,一场关于 AI 技术未来走向的深度对话在知名播客《20VC》中拉开帷幕。主持人哈里·斯蒂宾斯(Harry Stebbings)邀请到了全球人工智能领域的泰斗级人物...

整理|冬梅

在人工智能狂飙突进的当下,一场关于 AI 技术未来走向的深度对话在知名播客《20VC》中拉开帷幕。主持人哈里·斯蒂宾斯(Harry Stebbings)邀请到了全球人工智能领域的泰斗级人物、谷歌 DeepMind 创始人德米斯·哈萨比斯(Demis Hassabis)。

在这场对话中,哈萨比斯不仅披露了 DeepMind 在 AGI 研发上的最新进展,更站在人类历史的长周期里,对算力瓶颈、科研体制、能源危机乃至人类本质等宏大命题给出了极具穿透力的见解。

对话的核心焦点在于对通用人工智能(AGI)到来的预判。哈萨比斯延续了其自 2010 年创业初期便保持的惊人一致性,认为 AGI 极大概率将在未来五年内实现。他强调,这一场革命的规模将十倍于工业革命,而速度却快了十倍。

他坦言,过去 15 年,奠定现代 AI 产业基础的突破性成果中,大约 90% 都出自谷歌大脑(Google Brain)、谷歌研究(Google Research)或 DeepMind。比如 AlphaGo、强化学习,当然还有 Transformer 架构。所以,如果未来还有关键突破,他依然认为谷歌是最有可能做出来的。

在谈及当前 AI 最大的瓶颈时他表示,算力是最大的瓶颈,但软件方面持续学习、记忆系统等方面如果取得突破,也将会 AI 技术的发展起到很大推动作用。

什么是 AGI,以及它何时会到来?

主持人:今天的嘉宾是这个星球上最伟大的头脑之一。能有机会和他坐下来长谈,我觉得自己极其幸运。在接下来的几年里,那些具备发明全新算法构思能力的实验室,将会比那些只会榨取现有技术红利的实验室拥有更大的优势。这是一次非常特别的对谈,我会铭记很久。

我们可以从很多话题切入,但我最近看了你参与的那部纪录片,拍得太棒了。所以我想从 AGI(通用人工智能)聊起。关于 AGI 的定义千差万别,而你对它的思考一直非常深刻。所以我想先请你讲讲,在你看来,AGI 到底意味着什么,你如今是如何定义它的吗?这样我们可以达成一个共识。

Demis:我们对 AGI 的定义始终非常一致:它本质上是一个能够具备人类所有认知能力的系统。

这一点很关键,因为人脑是我们目前已知的唯一“存在证明”,证明通用智能在宇宙中是可以实现的。所以在我看来,这就是 AGI 应该达到的标准。

主持人:下面这个问题可能最难回答:我们离 AGI 还有多远?每个人的说法都不一样,当你听到一些大人物说最早可能在 2026 或 2027 年实现时,真的很难判断。

Demis:我自己是用一个概率分布来看待这个时间问题的。但我会说,在未来 5 年内实现 AGI 的可能性非常大。

主持人:那真的没剩下几年了。这比你预想的要快吗?随着时间推移,你的预测变了吗?

Demis:其实没有太大变化。挺有意思的,我的联合创始人 Shane Legg(现任 DeepMind 首席科学家)在 2010 年我们刚创立 DeepMind 时,就写过博文预测 AGI 什么时候会到来。要知道,在 2010 年几乎没人研究 AI,大家都觉得那是死胡同。

那些文章现在还在网上,大家可以去查。当时我们根据算力和算法的进步做了外推,预测从起点开始大约需要 20 年。我认为我们目前的进度完全符合预期。

当前 AI 最大的瓶颈除了算力,就是持续学习

主持人:站在今天看,最大的瓶颈是什么?在纪录片里你说过算力永远不够。除了这个,还有什么在阻碍 AI 的发展?

Demis:我认为算力依然是核心瓶颈。这不仅仅是为了所谓的“缩放法则(Scaling Laws)”,即通过堆更大的架构和参数来提升智能。更重要的是,算力还是实验的基础。云计算本质上就是我们的“实验台”。

如果你有一个新的算法想法,你必须在足够大的规模上测试它,否则当你把它放进主系统时,它很可能无法成立。所以,如果你有很多研究人员不断提出新想法,就需要大量算力去验证它们。

主持人:你提到了“Scaling Laws”。很多人暗示我们正触及这一法则的天花板,开始看到平台期效应了。你觉得这是真的吗?

Demis:我不这么认为。我觉得情况比这要复杂。当领先的公司开始构建这些大语言模型时,当各大公司开始构建大语言模型时,每一代系统都会带来巨大的性能跃迁,甚至接近翻倍增长。但这种增长速度不可能永远保持指数级,放缓是必然的。不过,这并不意味着继续扩大规模就没有回报。实际上,我们和其他前沿实验室,依然能从扩大算力中获得非常可观的收益。

只是相比最初阶段,这些收益有所下降,但仍然非常显著。

主持人:哪些方面的发展超出了你的预期?又有哪些关键能力还缺失?

Demis:实际上,大多数领域都比我预期的要快。看看现在的视频模型,甚至是我们最新的 Genie 系统,那是互动的世界模型。如果你退一步思考,这简直不可思议。如果 5 到 10 年前你把这些展示给我看,我会非常惊讶。

所以,在大多数领域,我们都超前于行业预期。但确实还有一些重大缺陷,比如“持续学习(Continual Learning)”。现在的系统在训练完成并部署之后,基本就停止学习了,它们不擅长在实际应用中进一步吸收新知识。

主持人:请原谅我问一个比较直白基础的问题:为什么我们至今还没能实现“持续学习”?

Demis:因为这个问题还没有被真正解决。目前所有领先实验室都在研究:如何把新知识整合进已经训练了数月的系统中。人脑在这方面做得非常优雅,比如通过睡眠和强化学习机制。大脑会在睡眠中“回放”白天的记忆,然后把部分信息整合进已有知识体系中,这个过程叫做“巩固”。我想了很久,也许我们需要类似的机制,将新信息与既有的信息库融合

DeepMind 凭什么能反超竞争对手?

主持人:DeepMind 最近进展非常快,甚至在一些领域实现了反超。我之前还发过一条推文,说我现在做研究时最常用的工具已经变成了 DeepMind 的系统,但以前并不是这样。到底是什么推动了这种加速?

Demis:我们做了一些组织架构上的调整。我认为在谷歌和 DeepMind,我们一直拥有最深厚、最广博的研究人才储备。

如果你回顾过去 15 年,奠定现代 AI 产业基础的突破性成果中,大约 90% 都出自谷歌大脑(Google Brain)、谷歌研究(Google Research)或 DeepMind。比如 AlphaGo、强化哪些证可以落户上海,undefined学习,当然还有 Transformer 架构。

所以,如果未来还有关键突破,我依然认为我们是最有可能做出来的。

我们做的主要是两件事:

第一,把公司内部所有顶尖人才整合在一起,朝同一个方向推进。

第二,整合算力资源,用于训练统一的大模型,而不是分散成多个项目。

本质上,是把已有的“所有要素”整合起来,然后以创业公司的节奏,全力推进,从而重新回到技术前沿,并在很多领域实现领先。

主持人:你说如果有人能实现下一个突破,那理应是你们。那么,“持续学习”是你最期待的下一个突破吗?

Demis:缺失的环节还有很多。除了持续学习,我认为在“记忆系统”上还有很大空间。目前我们使用的是长上下文窗口(Long Context Windows),这有点像“暴力破解”,把所有东西都塞进去,未来会有更精妙的架构。

此外,还有长期规划、层次化规划能力。现在的系统不擅长进行跨越长周期(比如数年)的规划,而人类可以。还有一个最大的问题是“一致性”。我有时称这些系统为“参差不齐的智能(Jagged Intelligences)”,因为它在某些任务上表现极其出undefined色,但只要稍微换一种提问方式,就可能在非常基础的问题上失败。

而真正的通用智能,不应该有这种不稳定性。

主持人:是的,这一点在实际使用中非常明显。稍微改一下输入方式,整个系统就可能崩掉。

Demis:没错,那简直是灾难。一个真正的通用智能,如果类比人类大脑的工作方式,是不应该有这种“智力黑洞”的。

主持人:我们刚刚聊到规模定律趋缓的问题。现在很多人也在讨论另一个趋势——模型能力是否正在“商品化”。你认为我们会进入一个模型能力趋同的时代,还是会出现一两家持续拉开差距、不断领先?

Demis:我觉得三四家领先的实验室(包括我们在内)正在开始拉开差距。因为 AI 工具本身就能反过来帮你构建下一代系统——比如编程工具、数学工具。现在想仅靠旧有的思路挤出同样的增量已经越来越难了。在未来几年,那些能够发明全新算法构思的实验室将拥有巨大的优势,因为上一代技术的潜力几乎已经被榨干了。

开源模型的未来

主持人:多年来你一直对研究非常开放,现在市场上有很多优质的开源模型。你怎么看开源的未来?我投资的很多公司会先用闭源前沿模型设定标杆,然后用开源模型来追求性价比。

Demis:这种格局可能会持续下去。我们一直是开源科学和开源模型的支持者,从最初的 Transformer 到 AlphaFold,我们把这些成果献给世界以帮助研究。未来我们也会继续这样做,尤其是在 AI 赋能科学这种我个人非常热爱的领域。

但我认为,开源模型可能会始终比最前沿的闭源模型落后一步。通常开源社区需要大约六个月的时间来复现和消化最尖端的新思路。同时我们也正在全力推进 Gemma 系列开源模型,力求在同尺寸中做到全球最强,非常适合开发者、学术界和边缘计算。

主持人:关于“后 LLM 时代”,不同人有不同看法,比如 Yann LeCun 认为后语言模型时代会是世界模型时代。

Demis:我在某些观点上和 Yann LeCun 有所不同。我认为,有大约 50% 的可能性是世界模型,但在“世界模型”方向上我们还缺少一些关键突破。但我坚信这些底层的基座模型(Foundation Models)已经非常成功了,它们的能力不会消失,我们依然能从缩放法则中获益。

未来的关键问题在于:AGI 系统是将 LLM 作为唯一的核心组件,还是作为整个系统的一部分?我觉得未来的方向是在这些基座模型之上进行构建,而不是取代它们。

主持人:如果 AGI 在五年内实现,那会是一个什么样的世界?

Demis:我这一生都在为 AGI 努力,我眼中的正面图景是:它将成为科学和医学的终极工具。我希望五年多以后,我们能进入一个科学发现的“黄金时代”。我母亲患有多发性硬化症,这也是我最关心的问题之一。

让我焦虑的是,药物研发周期太长了,从发现到真正应用,可能要十年时间。

AI 带来的是失业潮还是新机遇?

主持人:关于药物研发,我担心的是即便 AI 找出了药物,临床试验、层层审批可能还是要花上十年。

Demis:确实。我们在 AlphaFold 项目后成立了 Isomorphic Labs,专门攻克药物研发的其余环节,比如化学设计、化合物合成、毒性检测等。未来 5 到 10 年,这套全自动设计引擎就会准备就绪。下一步确实是临床试验耗时太久的问题。AI 可以在这方面提供帮助,比如模拟人体代谢,或者对患者进行分层,确保特定基因组的患者得到最精准的药物。

主持人:真正的革命什么时候会发生?

Demis:当有十几种左右的 AI 研发药物完整走通全流程时,政府和监管机构就会看到足够的数据。再往后十年,也许我们就能完全信任模型的预测,从而跳过某些步骤,比如不再需要动物实验,或者更快地提高临床剂量

主持人:聊到监管,霍金曾说过:“我们必须第一次就做对,因为我们可能没有第二次机会。”你认同吗?

Demis:我完全认同,这正是我们面临的赌注。我有两个担忧:一是坏人滥用,AI 是一种双用途技术,既能治病救人,也能被用于破坏;二是技术性问题,当模型在未来一两年变得更具自主性(Agentic)、更独立时,我们能否将其限定在预设的护栏内?我们需要国际通用的最低标准。

主持人:什么样的监管才是对的?你提到过需要全球协作,但让我担心的是,现在的国际环境似乎越来越缺乏协作。

Demis:确实,在面临人类历史上最具影响力的技术时,国际局势却如此碎片化,这很疯狂。但我们必须尝试,至少要建立一些测试不良特性的基准,比如“欺骗性”。没人希望构建一个具备欺骗能力的系统,因为那样它就能绕过其他安全机制。理想情况下,应该像颁发质量合格证(Kite Mark)一样,有一个认证过程。这必须是跨国界的,因为这些系统本身就是跨地域运行的。

主持人:很多人担心 AI 会导致劳动力流失。之前马克·安德森(Mark Andreessen)上节目时说我是“马克思主义者”,因为我提到了失业焦虑。他觉得这是瞎操心,认为历史总能克服这些挑战。你怎么看?

Demis:历史上每一次技术革命确实都会带来职业动荡,旧工作消失,新工作产生。但我认为这次的规模会比以往任何一次都要大。我常说 AGI 的到来相当于“10 倍规模的工业革命”,而且速度快了 10 倍——它会在十年内铺开,而不是一个世纪。我们当然不希望工业革命没发生(否则就没有现代医学了),但这次我们要比那时更好地缓解负面影响。

主持人:大家都说我们总会高估一年的变化,而低估十年的变化。在 AI 领域也是这样吗?

Demis:依然如此。就今天而言,AI 的短期热度确实有点过头了;但从十年的跨度来看,人们依然严重低估了它将带来的革命性影响。关于贫富差距,我认为各国政府应该考虑让养老金或主权基金买入大型 AI 公司的股份,让每个国民都能从生产力暴涨中分一杯羹

主持人:AI 革命对能源的需求是前所未有的。我们该如何解决这个能源黑洞?

Demis:长期来看,AI 会“反哺”能源成本。我们正在优化现有的电网基础设施,效率能提升 30%-40%。最让人兴奋的是 AI 在新材料和核聚变上的应用。我们正与合作伙伴研究核聚变。一旦突破了核聚变或超导体,人类将进入一个能源接近无限且成本极低的时代,到时候连火箭燃料都能低价获得,太空旅行也会变得极其廉价

为什么留在英国,而不是搬去硅谷?

主持人:你长期留在英国伦敦,但肯定有无数人劝你搬到美国去,你为什么坚持留下?

Demis:因为英国有着令人艳羡的人才。我们拥有剑桥、牛津、帝国理工、伦敦大学学院等世界前十的名校,还有从图灵、牛顿到霍金的科学传承。这里有最聪明的科学家和工程师,只是过去没被转化成野心勃勃的深科技(Deep Tech)创业项目。

而且,留在伦敦有一个“结构性优势”:离硅谷远一点,虽然会错过一些八卦和风口,但它能让你更深入、更原创地思考。深科技需要 20 年的长远眼光,而不是追逐当下的噱头。

主持人:欧洲会有万亿美元市值的公司吗?

Demis:我相信可以。比如 Spotify,或者我的 Isomorphic Labs。欧洲目前的短板是市场比较碎片化,而且缺乏支撑超大规模融资的资本市场。在英国,我们擅长把初创公司带到一定高度,但要跨越到万亿美元级别,还需要解决养老基金投资准入等资本限制。

初见马斯克的感受

主持人:简单聊聊,第一次见马斯克是什么感觉?

Demis:大约在 2011 或 2012 年。我们在彼得·蒂尔(Peter Thiel)的 Founders Fund 投资年会上遇到的。当时 SpaceX 是明星,我们还是个小项目。我们在洗手间附近打了个招呼,一拍即合。我们都对科幻充满热爱,也都极具野心。第二次见面我就去了他的火箭工厂。

主持人:医疗革命方面,你最想看到什么?

Demis:我想彻底治愈癌症。Isomorphic 正在构建一个通用的药物设计平台。从神经退行性疾病到癌症,我们希望它能适用于每一个疾病领域。

主持人:有什么关于 AI 的大问题是现在没人讨论的?

Demis:大家都在讨论经济问题。但我更担心哲学问题。假设我们搞定了技术和经济,剩下的就是:什么是“意义”?什么是“目的”?当 AI 出现,人类的本质又是什么?我们需要伟大的新一代哲学家来帮我们导航。

主持人:最后,你希望自己留下什么样的遗产(Legacy)给这个世界?

Demis:我希望被记住是因为推动了科学的进步,并构建了能治愈可怕疾病、造福全人类的技术

参考链接:

https://www.youtube.com/watch?v=SSya123u9Yk&list=PLnJFlI3aINuUNaznonoFEgMUGLBiLmB-w&index=1

声明:本文为 InfoQ 整理,不代表平台观点,未经许可禁止转载。

今日好文推荐

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题,聚焦 100+ 重磅议题,汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家,围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

网友评论:

推荐使用友言、多说、畅言(需备案后使用)等社会化评论插件

Copyright © 2024 上海落户 版权所有
沪ICP备2021003381号
Top