新闻 发表于 2025-6-22 23:11

AI 的下一个十年:Greg Brockman 谈 OpenAI 的能源瓶颈、数据墙与产品哲学

作者:微信文章
AI 的突破、挑战与未来展望:与 Greg Brockman 的深度对话

核心要点

01深度学习与算力规模的结合是当前人工智能飞速发展的核心驱动力。02OpenAI 的发展路径强调从实践中总结规律,例如通过 Dota 2 项目验证了“规模化假设”的有效性。03AI 在个性化服务、医疗、教育和编程等领域已展现巨大潜力,但仍面临操作系统集成、数据接口等挑战。04未来 AI 有望在科学发现(如解决千禧年大奖难题)上取得突破,但这依赖于算力、能源的持续增长以及算法的不断创新。05尽管 AI 发展迅速,但其具体路径和成果往往充满惊喜,持续产出具有颠覆性的成果是 OpenAI 的追求。
背景



本次对话由 Stripe 联合创始人 Patrick Collison 主持,嘉宾为 OpenAI 联合创始人 Greg Brockman。Greg Brockman 在2010年从麻省理工学院辍学后成为 Stripe 的首位工程师,并于2015年升任首席技术官。离开 Stripe 后,他参与创办了 OpenAI。对话围绕人工智能的近期突破、OpenAI 的发展历程、当前面临的挑战以及对未来的展望展开,Greg 分享了其在 AI 领域的深刻见解和 OpenAI 的实践经验。
01 AI 突破的感知与深度学习的崛起



本章节探讨了普通人如何感知技术突破的临近,并回顾了深度学习如何在2010年代末期异军突起,成为推动 AI 各领域(如图像识别、大语言模型、语音技术)同时进步的核心因素。
Patrick Collison
假设你没有投身人工智能领域,那么普通人要怎么才能察觉到,某个领域即将迎来突破呢?毕竟,上世纪七八十年代,甚至九十年代,就一直有人在说人工智能是未来。然后,非常快地,在2010年代末,一切似乎都开始真正发生了。

我一直在琢磨一个事儿,就是为什么这么多不同的技术会在差不多同一时间都开始奏效。我们有了表现惊人的大语言模型,但与此同时,图像模型也取得了实实在在的进展。而且,文本转语音和语音转文本技术也比以前强太多了。那么,所有这些技术同时开始取得突破,背后的共同因素到底是什么?
Greg Brockman
我当时并不在这个圈子里,因此对那时的感受记忆犹新。大概是2013年、2014年那会儿,感觉每天 Hacker News 上都会冒出一篇关于“深度学习赋能某某领域”的新文章。我当时就在琢磨,到底什么是深度学习?我在这个领域大概只认识一个人,就请他帮忙引荐更多业内人士。结果,我不断被介绍给我在大学里结识的那群最聪明的朋友。

现在回过头看当时的研究,基本上是在2012年,图像识别第一次可以通过神经网络得到解决,而且效果远超以往任何方法。这一下子就把所有传统的计算机视觉方法都给颠覆了。就好比这样一个后天习得的系统,它能够超越那种积累了四十年、试图“把所有规则都写下来,然后手工为特定任务打造算法”的成果。

是深度学习,我认为深度学习是核心驱动力。
Patrick Collison
但深度学习这个概念我们早就有了。比如,为什么深度学习在上世纪八十年代没有成功呢?
Greg Brockman
好的,这么说吧,你看看从1940年到今天,我们算力经历了多少个数量级的增长,那简直是天文数字。
Patrick Collison
你觉得这些进展都能用算力的规模扩张来解释吗?当然,前提是应用在正确的算法上。
Greg Brockman
算法的类型本身也在演进,有些成果甚至不能完全归功于深度学习。但我认为,从根本上讲,算力是关键,而且你需要一个可扩展的、能够真正消化这些算力的算法。
02 OpenAI 的实践与启示:规模化假设与 Dota 2 项目



本章节聚焦 OpenAI 的发展历程。Greg Brockman 阐述了 OpenAI 如何通过 Dota 2 项目的实践,逐步认识并验证了“规模化假设”的有效性,并分享了从该项目中获得的关于项目管理和深度学习本质的重要启示。
Patrick Collison
OpenAI 是第一家真正严肃对待“规模化假设”(scaling hypothesis)的公司吗?
Greg Brockman
我觉得要宣称自己是“第一”总是挺难的,但我认为很明显,我们比其他任何人都更早、更疯狂地取得了成功。所以,我想我们对于自己需要做什么,有着非常坚定的信念。有些人觉得 OpenAI 最初的目标就是为了证明规模化假设,但实际情况几乎是反过来的:规模化假设是我们观察到对我们行之有效的方法。而且,我们第一次真正意识到这一点,其实是在做 Dota 2 项目的时候。一开始,Yaroslav(Sutskever)和 Szymon(Sidor)在他们的台式机上,用16个核心来训练一个小智能体。他们把核心数增加到32个。给我的感觉是,几乎每个星期他们都会把规模再扩大一倍,然后我们的性能也提升一倍。情况非常明朗,你只需要继续投入算力。这东西的瓶颈到底在哪里?结果它似乎一直没有出现瓶颈。
Patrick Collison
创始人是不是往往被过誉了?因为通常是你有一个初步的产品,一个还算靠谱的想法,然后你听取用户的反馈,沿着有用的方向不断迭代。所以你的意思是,OpenAI 在规模化假设这事上也是类似的路子:你们开始尝试让 Dota 智能体跑起来,然后发现增加算力效果特别好,于是你们就想,其他地方是不是也可以通过砸更多算力来获得收益?
Greg Brockman
我认为,大体上是这样的。而且我觉得,OpenAI 和典型的初创公司有一个显著区别,那就是我们做所有事情几乎都是反着来的。常规的创业思路是你得先找到一个要解决的问题。但我们当时根本不知道问题是什么,也没人关心技术本身。
Patrick Collison
而是先把公司实体给建立起来了。
Greg Brockman
完全正确。对我们来说,我们确实是在对应用前景一无所知的情况下,一头扎进了对技术的追求。而且,很多时候,追求技术就意味着你必须做好准备,让残酷的现实给你迎头痛击。除此之外,别无他法能取得成果。你不可能凭空把它变出来,也不可能靠说服别人来让它成真。你必须得让系统真正运转起来。我们必须去摸索,什么是真正的技术前沿,面临哪些问题,哪些东西正处在突破的边缘。然后,在这些关键点上加倍下注。
Dota 2 项目的启示


Patrick Collison
你从 Dota 项目中还领悟到了什么?比如,它在其他方面还有哪些影响?可以说,你们当初完全可以直接从大语言模型入手,跳过那段在“无人区”摸索的时期,但听起来,Dota 项目对 OpenAI 这个组织的形成还是挺关键的。
Greg Brockman
我觉得 Dota 项目带来了很多启示,其中之一其实是给我个人上了一堂管理课。我记得项目刚开始的时候,我试图定下一连串的里程碑,例如某个日期我们要达到某个水平。但那套方法根本行不通。我记得我们的第一个里程碑节点到了,结果完全没戏。所以你很快就会意识到,你根本控制不了结果,你不能设定那种基于产出的里程碑。你能控制的是投入,比如我们要在某个日期前完成这些实验,我们要在某个日期前实现这个功能。这才是真正奏效的做法。

那段经历就像一个经典故事。当时我们先是打败了公司内部最强的选手。然后我们找来一位半职业选手对练,他把我们虐得体无完肤。再后来,我们突然就变得相当厉害了。于是,我们报名参加了国际邀请赛(The International)。第一天,我们对阵了三位选手,战绩是三比零、三比零,然后是二比一。我们当时就想:“哎呀,不好,我们输了一局,怎么回事?”后来才发现,跟我们对战的那位职业选手用了一个我们训练时从未见过的道具。我们当时就傻眼了:“天呐,这下彻底完蛋了。”于是大家通宵达旦地赶工,把那个额外的道具加了进去。周三凌晨四点,他们终于让新版本跑起来了。

那天,我们原计划是要和世界排名第二和第一的选手对战。我们的半职业选手试玩了一下新版本,然后说:“这个机器人完全出问题了。”我们心想:“坏了,肯定出了个大bug。”他说:“你们看,它承受了这么多不必要的伤害。我要去干掉它。”结果他冲上去想干掉机器人,反而自己输了。他当时就说:“太诡异了。”他意识到,机器人学会了一种诱敌深入的策略。然后我们发现,我们虽然有了一个超级机器人,但它在游戏开局阶段表现很差,因为它总想着用诱敌计。所以我们灵机一动,如果我们把现有的两个机器人版本结合起来会怎么样呢?结果,那个融合版的机器人就变得所向披靡了。我们最终和世界第一的选手对战,并且赢了。对我来说,这就是深度学习如何运作的缩影:你有点像无法控制最终会走向哪里。你能控制的是所有的输入,你可以设定各种指标和衡量标准,你可以进行评估。而能够准确判断自己所处的位置,几乎和取得进展本身一样重要。但如果你把所有这些要素都处理得当,那你就能创造出真正的奇迹。
Patrick Collison
你也描述了一种对组织而言非常有效的激励机制,它能让大家心甘情愿地通宵工作。如果目标遥不可及,可能就没那么大的驱动力了。但事实上,短期内能看到回报,而且你们能够展示出实实在在的进展。
Greg Brockman
我想是的。我一些最喜欢的工程故事,都有类似的桥段。我记得当年你和我为了搞定我们的 ISO 8583 支付接口集成,也是熬了个通宵。
03 AI 能力的边界与个性化挑战



本章节讨论了当前 AI 能力的边界,如图灵测试的完成度,以及 AI 创造经济价值的现状。重点探讨了个性化作为 AI 产品下一个重要发展方向,以及 OpenAI 如何在产品和研究层面推动其实现。
Patrick Collison
Dota 被攻克了,国际象棋被攻克了,围棋也被攻克了。我认为,无论用什么标准来衡量,我们都已经通过了图灵测试。人们评论说,我们通过图灵测试时几乎没什么大张旗鼓的宣传,但我们似乎确实是做到了。那么,什么是下一个合适的、新的图灵测试呢?
Greg Brockman
我跟你说两点。第一,如果你严格按照图灵测试的定义来看,我其实认为我们还没有完全做到。没有人真正下大力气去验证我们是否能创造出一个与人类完全无法区分的人工智能。而且,这甚至都不清楚是不是一个有意义的目标。但我认为,你提出的真正有价值的问题是,从能力角度看,我们应该追求的下一个里程碑是什么?我记得在2018年和我们的一位董事会成员聊天,他说:“听着,我明白你们都为你们的通用人工智能(AGI)目标感到兴奋,但感觉这事儿还没影儿呢。”我问他具体是什么意思。他说:“如果 AGI 近在眼前,那么按理说人工智能应该已经创造出巨大的经济价值了。可现在价值在哪儿呢?”在2018年,我觉得这个批评非常中肯,而现在情况显然开始不一样了。
Patrick Collison
我感觉,有一件事或许会真正改变人工智能市场,那就是个性化。直到不久前,当你向大语言模型提问时,感觉就像走进一家街边的陌生小店,店员对你一无所知。这对于你数字生活中如此贴近的一部分来说,显然不是理想状态。我很好奇,从产品的角度来看,你们是如何思考个性化的?因为在我看来,这可能是自聊天界面出现以来,最具变革意义的一件事了。
Greg Brockman
我绝对认为个性化至关重要,而且我觉得它被理所当然地视为下一个技术前沿。举个例子,我以前用谷歌搜索东西的时候,总是会开无痕模式,因为我甚至不希望我的电脑记住那些搜索历史。用 ChatGPT 的时候,我也习惯开临时对话。但现在我的使用习惯完全反过来了。我希望 ChatGPT 能够了解并记住一切。我希望它能记住我所有的互动记录,因为这太有用了。
Patrick Collison
好的。所以你们从产品的角度,找到了让“记忆”功能更好用起来的方法。
Greg Brockman
这其实既是产品层面的考量,也是研究层面的重要方向。
Patrick Collison
我猜想产品和研究之间应该存在一种相互促进的循环:当你们从产品角度发现某个功能很有用时,产品团队就会说——我只是个产品人员——“你们研究团队去把这个功能做得更好”,然后这就反过来催生了更多的研究,是这样吗?
Greg Brockman
实际上,在某种程度上,这种明确的划分在我们看来反而是一种潜在的失败模式。我们非常不希望出现那种壁垒分明的情况,而是真正希望模糊界限,鼓励大家跨团队协作。这与传统的产品开发思路和研究方法的心态是大相径庭的。实际上当时的情况是,我们有了GPT-3,我们知道必须要做出一款产品才能继续融资。我们当时就在想,到底要做什么产品呢?我们列出了一百多个不同的产品方向。比如我们可以做医疗相关的,但那样一来,你就得考虑向医院销售,得雇佣医生。然后你就会发现,你基本上就放弃了通用人工智能(AGI)的大目标,你会一头扎进某个具体的垂直领域。所以后来有人提议说,为什么我们不干脆只做一个 API,让别人去探索应用场景呢?这又完全是创业的反常规操作,你应该先有一个明确的问题要解决。而我们当时根本不知道问题是什么。
Patrick Collison
然后再倒过来找问题。
Greg Brockman
所以,这感觉可能是我职业生涯中做过的最艰难的项目,因为它当时看起来完全没有成功的希望。那种感觉就是,我的每一个直觉,每一个作为创造者的本能都在告诉我它真的感觉毫无希望,感觉是彻底没戏了。
Patrick Collison
但你还是坚持做下去了。
Greg Brockman
我的意思是,在某些时候,如果你没有退路,那就真的没有其他选择了。当时确实没有别的路可走,那是我们唯一的赌注。我记得还有人说:“我简直无法想象会有人愿意为这个模型的输出样本付费。”我当时心里想:“你说的可能没错。”

当时就是非常不确定,我们到底是跨过了成功的门槛,还是离门槛还差得远。然后,我们把模型展示给一些人看,大家确实表现出了兴趣,但这和人们说“我要把我的公司建立在这个技术之上”是完全两码事。
Patrick Collison
第一个真正获得一些市场反响的应用是什么?
Greg Brockman
是 AI Dungeon。那是一款基于文本的冒险游戏。我相信他们是我们的第一个付费用户。
Patrick Collison
你会不会因此感到困惑,心想:“啊,看来 OpenAI 的未来果然在游戏领域啊。”
Greg Brockman
又回到了我们的初心。完全正确。这事儿也挺有意思的,因为我们曾经梦想过所有这些高大上的应用场景,是的,还有医疗等等。结果你却从一个游戏应用开始起步。但我们确实在许多其他领域也看到了希望的曙光。我觉得从很多方面来看,GPT-3 就像是世界上最棒的演示生成器。当我们发布 API 的时候,人们想出了各种各样酷炫的点子,但是要让它们真正可靠地运行起来,可靠性太难保证了。直到下一代模型 GPT-4 问世,直到我们开始摸索出如何有效地进行后训练(post training),你才真正能够基于这些技术构建起可持续的商业模式。
04 AI 的广泛应用与现实挑战



本节讨论了 AI 在医疗、教育、生活指导和编程等领域的广泛应用潜力,并指出了 AI 产品在操作系统层面面临的集成和便利性挑战。Greg Brockman 强调能力是驱动用户采纳的关键,而便利性会随之提升。
Patrick Collison
Bill Gates 最近表示,GPT-4是他自从在施乐帕洛阿尔托研究中心(Xerox PARC)看到演示以来,所见过的最棒的技术演示。你知道这句话吗?
Greg Brockman
他是在看到演示的那天晚上亲口对我说的。这评价可真够高的。
Patrick Collison
我想再聊聊你提到的医疗领域。就像你说的,你家人有一些亲身经历,你提到过通过 AI 获得了非常有价值的诊断帮助。我们家其实也有类似情况,虽然是小事一桩,但我们通过大语言模型进行“诊断”,成功治好了一只猫的毛病。我觉得这是一个很有意思的例子,因为我认识的很多人都有过类似的经历。也许是因为现实中你很难从医生那里得到足够充分的交流时间。除了医疗应用,还有没有其他类似的领域,你看到很多成功的应用,很多人都有类似的故事,但我们平时听说的比较少?
Greg Brockman
是的,这是个好问题。顺便说一句,我觉得像医疗这样的领域,我当初以为会是我们最后才能成功创造价值的几个领域之一,但事实证明,这个领域的现有水平门槛并不高,你只要能做得比 WebMD 好就行了。所以我认为,我们确实在其他一些领域也看到了类似的普遍需求和应用潜力。比如现在非常火的一个方向,就是类似人生导师、生活建议类的应用。像教育这样的领域,也明显地受到了深刻的影响。现在已经有研究表明,人们通过使用这些工具,学习效率确实能得到提升。
Patrick Collison
这也是意料之中的,对吧?这就像是布鲁姆“两倍标准差”效应在产品中的体现。
Greg Brockman
是的,完全正确。举个例子,这就是 Sal Khan 创办可汗学院的初衷。他思考的是,如果你能为每个人提供个性化的辅导会怎样。当我们向他展示 GPT-4 时,他立刻说:“就是这个了!我们必须成为一个基于 GPT-4 的应用。”所以,我认为这些真正令人惊叹的应用,正在深刻地影响着每个人的日常生活。当然,编程是另一个我认为大家在各种专业场景中都能感受到的领域。我们正在走向这样一个世界:就像如果你想高效工作却无法使用电脑,你一定会处处受限一样。同样地,无法使用人工智能,也正朝着这个方向发展。
Patrick Collison
说到无法使用人工智能,我会大胆猜测,如今人工智能产品的开发,主要还是受限于操作系统层面。你也是这么觉得吗?比如,我们目前是不是有点卡壳了?
Greg Brockman
我确实感觉到了一点点这种“卡壳”的情况,但不用太担心,这是可以克服的。两年前我们在 ChatGPT 里发布了插件功能,那会儿的想法是,想让任何人都能编写应用,然后 ChatGPT 可以调用这些应用,但当时模型的智能程度还不够。我们限制每次只能同时使用三个插件,能调用的函数数量也有限,而且整体可靠性也不高。现在 GPTs(用户自定义的 ChatGPT 版本)正在真正普及开来,它提供了一种将你的人工智能连接到不同外部工具的方式。这在很大程度上,也是在尝试采纳当年插件的思路,并真正让它落地生效。我们现在所面临的挑战其实很相似,就是我们缺少一些关键的接口,比如能够顺畅地访问你的手机以及手机上的各种 API。问题在于,模型的能力是否已经达到了可以有效使用这些接口的门槛。我的观察是,基本上,不同接口的开放和接入可能会有大约六个月的滞后期。但一旦我们拥有了足够强大的模型,我们总会找到办法。所以我认为,我们正处在一个我完全有理由相信,那个曾经被承诺的未来终将到来的世界,但这确实还需要一些努力。
Patrick Collison
我觉得很多时候,我用手机时都特别希望能有一个按钮,按下去就能直接问:“ChatGPT,你对这个屏幕上的内容有什么看法?”比如,我需要你的评论,我需要你帮忙核实事实,或者给我解释一下。但现在的操作是,你得先截个图,然后打开 ChatGPT 应用,再点击上传图片,这感觉非常像1993年的操作方式。显然,你们公司并没有权限去开发这样一个系统级的功能。这就是我说感觉我们有点受操作系统限制的意思。
Greg Brockman
我完全明白你的意思,但我想说,这里面有两个维度,这也是自从我们在2020年发布 API 以来我一直思考问题的方式:一个是能力(capability),另一个是便利性(convenience)。你刚才提到的,更多的是便利性层面的问题。截图再粘贴确实很不方便。但关键在于,如果能力足够强大,用户是愿意忍受各种不便的。打个比方,如果通过截图并把图片展示给 ChatGPT,它就能给你带来惊人的洞察,即使这个过程需要你花费一个月的时间,即使你必须爬到山顶才能完成,你也会去做。便利性不会成为你的障碍。所以我想强调的是,如果模型的能力足够强,人们自然会开始采用某种特定的操作流程。
Patrick Collison
所以是先通过强大的能力发掘出用例,然后便利性自然会慢慢跟上。
Greg Brockman
然后,在便利性方面,各方都会感受到巨大的压力。手机制造商有压力,我们有压力,生态系统里的每一个人都有压力,大家都会努力去降低这种使用的不便性。
05 AI 的未来疆界:科学发现、AGI 与资源瓶颈



本章节展望了 AI 在推动科学发现(如解决千禧年大奖难题)方面的潜力,并探讨了 OpenAI 对通用人工智能(AGI)层级的定义和当前所处阶段。同时,也触及了 AI 发展面临的算力、能源和数据墙等瓶颈问题,以及如何通过算法创新(如合成数据、强化学习)来应对这些挑战。
Patrick Collison
人们常常对人工智能提出这样一个批评:没错,它很棒,也很方便,诸如此类,但它在数学或科学领域,至今还没有提出过任何真正新颖的进展。你个人呢,或者说科学界呢,对这种批评有什么看法?
Greg Brockman
稍安勿躁,等着看吧。
Patrick Collison
好的。所以你认为,比如像千禧年大奖难题这样的挑战,我们有理由相信未来会看到人工智能解决它吗?
Greg Brockman
我认为那是必然的。这毫无疑问。
Patrick Collison
那大概需要两年、五年,还是十年?
Greg Brockman
我认为这才是真正的问题所在,归根结底只是时间问题。我觉得两到五年是一个比较靠谱的时间范围。而且我认为,这最终又回到了基准测试的问题上。能够真正解决一个千禧年级别的难题,这个门槛是相当高的。非常非常高的门槛。而一旦你能做到这一点,那其他许许多多的事情,就肯定也能迎刃而解了。我觉得我们现在已经开始看到这方面的一些苗头了。

对我而言,如果我们审视我们对通用人工智能(AGI)的定义,我们最近开始讨论一个关于 AGI 层级的框架,从聊天机器人开始,到推理器、智能体、创新者,再到能够自我驱动的组织,一共五个层级。我们现在基本上处在第三层级。而到了第四层级,也就是“创新者”这个层面,情况将会完全不同。你想象一下,把整个数据中心的所有算力都投入去思考一个难题,比如如何解决一个千禧年难题,或者如何攻克某种特定的癌症。那种级别的计算能力,再加上通过实验从自己的想法中学习的能力,这将是世界前所未见的景象。
Patrick Collison
所以说来说去,我们还是没有在这些难题上投入足够“体面”的算力,至少和我们未来将要投入的相比还差得远。
Greg Brockman
这些目前还都只是些“微不足道”的小型计算机集群。
Patrick Collison
这其实就引出了一个问题,就这些所谓的“规模法则”(scaling laws)而言,它们最终会不会因为我们耗尽了算力而走到尽头?或者说,我们最终会发展到发明出新型核能的程度,从而解锁下一个发展层级吗?现在新增的很多能源供应都流向了数据中心,这在你们当初开始训练 GPT-2 的时候可不是这样的。所以,这难道不就是即将到来的能源瓶颈吗?
Greg Brockman
理应如此。它确实应该发展到能源被高效地转化为智能,而能源供应成为你唯一的瓶颈。
Patrick Collison
但我认为,与过去几年我们所见证的指数级增长相比,那将会是一个相当漫长的平台期,除非在能源获取方面真的发生根本性变革,比如在项目审批、建设计划以及所有这些相关环节。
Greg Brockman
是的。但这才是问题的核心。如果你观察这个领域的每一个发展趋势,都会发现这些指数级增长的曲线,这些S形曲线叠加起来,最终呈现出指数增长的态势。
Patrick Collison
当然。但这些指数增长以往主要发生在像科技行业,硅谷这样的地方,在这些领域实现指数增长相对容易。但在项目审批、房地产开发、修建水坝、建造核电站这些实体建设领域,要实现指数级增长就困难多了。
Greg Brockman
让我们拭目以待吧,看看核聚变技术最终会发展成什么样。

我觉得我们很有可能最终会受到能源供应的制约。这实际上也是我们花了很多时间,不遗余力地去呼吁社会各界关注,强调我们迫切需要更多电力的原因之一。我对市场的观察是,最终,资本主义市场机制确实能够提供所需的供给。我感觉到一股绝对是海啸般的需求正向我们涌来。但我对此抱有一定信心,再说一次,当压力足够大,当目标足够清晰——这就是瓶颈所在,而且这不仅仅关乎某一家公司的存亡,这实际上关系到国家的整体竞争力。你看看其他一些国家,它们正在建设规模庞大的电力设施,远远超过我们。我认为,美国要想保持竞争力,除了大力发展能源建设,别无选择。
Patrick Collison
说到瓶颈,2023年的时候,大家都在热议所谓的“数据墙”问题。我觉得这事儿挺有意思的,现在几乎没人再提数据墙了,然而人工智能的进展似乎并没有因此放缓。这仅仅是当时对“测试时间”(test time)的误解吗?还是说,人们当初对数据墙及其瓶颈作用的判断是错误的?或者说,数据墙的问题其实依然存在,只是可能两年后才会真正显现出来?
Greg Brockman
基本上你说的这些因素都沾点边。核心在于你总是在不断地转换范式,这才是库兹韦尔(Ray Kurzweil)世界观的精髓所在。好吧,这种做事的方法可能已经到顶了。如果你只盯着这一种方法看,你可能会感到绝望。但不知何故,你总能找到一条新的S型增长曲线。我认为现在发生的就是这样。比如说,合成数据,再比如说,强化学习。如果你思考强化学习的模式,从根本上说,那也是一种数据生成机制,只不过是人工智能恰好在用自己产生的数据进行训练,然后你基于此进行快速学习和迭代。这些新的方法都让我们取得了长足的进步。所以我认为,还有很多算法上的新思路,很多新技术,很多甚至能更有效地利用现有数据的方法。所以我认为从根本上说,S型曲线的增长仍在继续,如果你把时间轴拉长来看,整个发展过程看起来依然是平稳且不间断的。
Patrick Collison
所以这有点像芯片制造中的小型化进程,每一代新技术出现时,人们都会说:“好吧,这已经是你能把芯片做得最小的极限了。”然后不知何故,我们总能找到新的突破口。
Greg Brockman
是的。不过,与芯片制造有一个不同之处在于,我认为最终还是会有一些物理上的限制。
06 AI 辅助编程的现状与 OpenAI 的产品哲学



本章节讨论了AI 辅助编程(如“氛围感编程”)的现状和未来发展,特别是 AI 在处理复杂代码库和承担代码重构等任务的潜力。同时,Greg Brockman 也分享了 OpenAI 在产品开发上的哲学,即如何在通用模型能力与特定产品应用之间进行权衡和聚焦。
Patrick Collison
AI 辅助编程(AI coding)未来会走向何方?特别是,“vibe coding”(姑且译为“氛围感编程”或“凭感觉编程”)现在非常流行,这差不多是2025年的年度热词了。它在某种程度上确实可行,而且效果相当惊艳。但目前还没有人真正敢在生产环境中,完全放手让AI软件工程师进行端到端的开发。所以我很好奇,你对未来一到两年内,人工智能辅助编程领域的发展有什么预测?
Greg Brockman
我的总体观察是,在这个领域,一旦某个东西开始“有点儿意思”了,那么它的下一代版本通常会非常出色。所以我认为,目前的人工智能辅助编程就处在这个阶段。因此,我想我们将看到人工智能承担越来越多的重复性劳动,更多那种令人头疼的、对人类而言不那么有趣的工作。不过,一个非常有意思的现象是,我觉得到目前为止,“氛围感编程”实际上接管了很多原本很有趣的编码工作,却把代码审查、部署这些一点也不好玩的事情留给了人类。所以我希望我们未来也能在这些“不好玩”的领域取得显著进展。但从根本上说,我们最终应该会拥有一个真正意义上的人工智能同事。

而且我认为它真的会是这样:任何你想创造的东西,你都可以扮演管理者的角色,你可以真正拥有一支由软件工程智能体组成的团队。现在,我觉得未来一个非常值得观察的有趣现象是,会不会出现一种AI反过来成为管理者的情况?由AI来给你提想法,给你分配一些任务去做。这又是完全颠覆我们现有思维模式的一种可能性。但是否存在某些方式,能让你真正为公司创造价值,并且让人们的工作因为拥有一个能够深度理解他们的AI而变得更有意义,就像你的专属AI医生能够深度理解你所有的健康需求一样。
Patrick Collison
我们这里讨论的这些挑战,是不是有一个共同的线索:很多时候人工智能工具之所以表现不佳,是因为它们试图解决过于宽泛和通用的问题?比如通用的语音识别效果不尽如人意,是因为它试图识别所有人的声音,而不是专门针对性地识别我个人的声音。同样地,在人工智能辅助编程方面,它们在完全不需要上下文信息,比如基于公开可用的库快速生成一个简单应用的场景下表现良好。但在需要理解一个包含数百万行代码的复杂代码库时,我们似乎还没有完全找到有效的方法来让它们做好这种个性化的理解和操作。这种类比是否抓住了这些挑战的共性?
Greg Brockman
我觉得你这里面提到了两点。第一,我认为这种情况已经在发生改变了。比如你看看像Codex这样的工具,它在处理大型代码库方面其实已经做得很棒了。比如我问它某个功能具体是在哪里实现的,它找起来比我还准。这本身就是一件挺不可思议的事情。实际上,这也是我们开发 Codex 时的一个重要目标:为那些不一定是在进行所谓“氛围感编程”的软件工程师们打造一款实用的工具。它不仅仅是为了从零开始构建一个新应用。实际上,我认为企业级应用场景中,最具杀手级潜力的功能可能是代码重构。比如重写你的核心应用程序,或者迁移你的系统。
Patrick Collison
就像当年 Facebook 为了实现静态 PHP 而开发 HipHop 那样。
Greg Brockman
完全正确。如果你仔细想想,完成一次代码重构所需的深度和复杂的思考,其量级其实并没有那么高。其中有大量的机械性工作,真正困难的是其庞大的工作量。而这,恰恰是非常适合人工智能来解决的问题。所以,我认为我们将因此在各种类型的人工智能辅助任务上看到生产力的巨大提升。现在,我们确实处在一个你刚才提到的,可能需要更聚焦的阶段。但我认为这些模型的工作方式是,你实际上确实希望拥有一个能够理解越来越多事物的通用模型,同时你也希望它能针对你个人进行一定程度的个性化。它们拥有一个基本上无所不知的基础模型,这本身就是一个非常有用的起点。所以我确实认为,未来我们会拥有能力越来越强大的基础模型,而关键在于如何将它与你所在组织的所有代码、上下文信息和历史数据真正有效地连接起来。
Patrick Collison
OpenAI 是如何决定要做哪些产品的呢?我很好奇你们是如何权衡,什么时候应该开发特定的产品,什么时候又觉得,哦,用 ChatGPT 就能解决问题,那样就足够了。
Greg Brockman
是的,这确实是个非常棘手的问题,也是我们一直在努力思考和平衡的事情。当我们第一次推出 ChatGPT 的时候,我们突然发现自己面临这样一个局面:我们既是一家面向企业的公司,也是一家面向消费者的公司。这对于一家初创公司来说,简直太可怕了。我记得当时和我们的一位董事会成员交流,他说:“感觉你们现在的策略有点缺乏焦点,”因为你们同时在做这么多不同的事情。但如果你换个角度想,也许可以把它类比成迪士尼这样的公司:他们先打造一个核心的知识产权(IP),然后会以各种不同的方式将这个IP产品化。我觉得我们现在的情况,也有点类似。

我们拥有核心的模型能力,然后我们面临的问题是,这个核心能力能够快速地为哪些应用领域带来巨大的价值,只需要投入少量额外的工作。所以我认为,决定进入哪些领域,关键要看这会让我们偏离主干道多远。还要看这个领域对于实现我们更大的战略目标有多重要,以及它与我们正在从事的其他工作之间能产生多大的协同效应。所以,像编程这个领域,它的协同效应就非常明显,投资回报率(ROI)也非常清晰,因为如果我们能通过AI工具提升自身的开发效率,那就能加速所有其他项目。
07 个人成长与对 AGI 的持续展望



本章节回顾了 Greg Brockman 在北达科他州的成长经历如何塑造了他,并探讨了他对通用人工智能(AGI)实现时间的预测演变。最终强调,AI 的发展总是充满惊喜,OpenAI 的目标是每年都能带来颠覆性的进步。
Patrick Collison
出生在北达科他州,这段经历对你有什么影响?它是如何塑造你的?
Greg Brockman
你看,北达科他州是个非常棒的成长环境。那里非常安全。我们家的门锁甚至都不怎么管用。我在学业上也有很大的自由度。六年级的时候,我父亲教了我一些代数知识。到了七年级,学校第一次把学生分到数学快班,我本应该学习初级代数。于是我母亲带我去见了数学老师,问老师我能不能跳级。那位老师非常居高临下地说:“每一位家长都觉得自己的孩子是独一无二的。我向你保证,你的儿子在我的班上绝对会面临足够的挑战。”结果呢,我在后排坐了一个月,基本上都在我的计算器上玩游戏。她还会时不时地随机点名叫我回答问题,想难住我,而我通常只是抬头看看黑板,然后就能说出答案。后来她说:“好吧,算你说得对。你的儿子在这个班上确实没什么可学的了。”于是他们把我调到了八年级的代数班。但到了八年级,我的初中已经没有更高级的数学课可以上了。
Patrick Collison
对,你后来是直接去大学上课了,对吧?
Greg Brockman
高中时期,我确实开始去北达科他大学选修一些课程了。但同时,我也通过参加像数学夏令营和数学竞赛这样的活动,认识了很多当时全国最顶尖的数学尖子生。
Patrick Collison
所以你是说,北达科他州的社交生活并没有让你太分心?
Greg Brockman
并没有太分心。但确实,也挺有趣的。
Patrick Collison
最后一个问题。你还记得吗,大概在2017年,我们一起去参加 Y Combinator 的创业营,当时我问你通用人工智能(AGI)大概还有多远能实现,你回答说是两三年。
Greg Brockman
我说过这话吗?
Patrick Collison
你确实说了。我只是想回顾一下,当时我的判断是对的,还是你的预测更准?我们应该如何评价那次预测呢?因为我们最终并没有在那个时间点迎来AGI,但也不能说我们完全没有取得任何进展。所以我很好奇,回顾你自己的AGI预测历程,你现在有什么感想?
Greg Brockman
我觉得人工智能总是充满了惊喜。我认为这像是唯一一个贯穿始终的主题,那就是我们当初设想的东西,最终得到的往往是不同的,但我们却得到了一些更好、更神奇、也更有帮助的东西。所以,我对此其实相当满意。现在,要预测未来会走向何方,再次强调,这真的很难去控制最终的产出。OpenAI 有一个我们已经成功实现的目标,那就是每年至少要拿出一个让人感觉比以往任何成果都有一个巨大飞跃的结果。
Patrick Collison
当你看到我们的时候,你只是希望每年都能有一个真正让人眼前一亮、充满AI魔力的东西问世。
Greg Brockman
就是那种感觉。我喜欢这种说法。但确实感觉,我们离一些非常、非常神奇的东西越来越近了。
Patrick Collison
我同意。非常感谢你。
Greg Brockman
谢谢。
页: [1]
查看完整版本: AI 的下一个十年:Greg Brockman 谈 OpenAI 的能源瓶颈、数据墙与产品哲学