AI最新消息速递 | 20250820期 ChatGPT智能体进入行动时代
作者:微信文章img
特朗普即将推出的20页AI执行方案主要侧重于传达一种“不干预、促进增长的方式”,并设定了包括促进创新和减轻监管负担在内的宏伟目标。但真正的行动在于正在起草的行政命令,其中包括由AI沙皇大卫·萨克斯牵头的一项命令,该命令要求政府只采购“中立”技术,以对抗“觉醒”AI。没有什么比在AI采购中强制要求意识形态纯洁性更能体现“政府不干预方式”了。
今日AI最新资讯,打破信息差:
• 💊量子增强药物研发• 🤖机器人能否通过吞噬其他机器人来成长?• 🎬 ChatGPT智能体进入行动时代
💊 量子增强药物发现
img
来源:IBM
Moderna和IBM的研究人员取得了他们所谓的一项创纪录的突破,即利用量子计算机来预测mRNA分子如何折叠——这是设计有效的基于RNA的药物的关键一步。
这项合作在IBM新发布的案例研究中详细介绍,展示了量子算法成功预测mRNA自我折叠时呈现的3D形状。该团队使用具有80个量子比特(量子信息的基本单位)的量子处理器,对长度达60个构建单元的基因序列进行了测试。研究人员称,此前还没有人在量子计算机上模拟过长度甚至只有42个构建单元的序列。
该团队借鉴了华尔街交易中常用的一种风险评估技术(通常用于衡量投资组合在最坏情况下的表现),并对其进行了调整,以帮助量子计算机专注于最有前景的分子形状,同时忽略计算误差。Moderna量子算法与应用副科学总监阿列克谢·加尔达(Alexey Galda)表示,这种量子方法比传统计算机单独使用能提供“更多样化的解决方案”。
• 发表在IEEE量子计算与工程国际会议上的一项研究表明,量子方法在寻找最优分子构型方面与商业软件表现相当。• 计划于今年晚些时候发表的即将开展的研究,将使用156个量子比特来解决更大的问题。
该合作源于Moderna参与IBM的量子加速器计划,这是制药公司探索量子计算在药物研发中的应用的更广泛举措的一部分。
**重要性:Moderna数字业务高级副总裁韦德·戴维斯表示,虽然量子技术不会取代传统计算,但它可以加速药物研发这一以缓慢著称的过程。了解mRNA如何折叠对于设计能有效发挥作用且不会引发不必要免疫反应的药物至关重要,这有可能推动救命疗法更快地推向市场。
🤖 机器人能否通过吞噬其他机器人来成长?
img
来源:Midjourney v7
研究人员开发出了能够通过消耗其他机器人部件来实现物理生长、自我修复和进化的机器人——这一突破可能从根本上改变机器在不可预测环境中的运行方式。
本周发表在《科学进展》杂志上的该系统使用了名为桁架连杆的模块化单元,这是一种带有磁性连接器的轻质杆,可以在多个角度连接。单个连杆只能前后爬行,但当它们组合在一起时,就会形成越来越复杂的结构。
在测试中,六个链节自组装成一个会行走的四面体,它捡起第七个链节,速度提升了60%以上。受损结构通过与散落的部件重新连接来自我修复,模仿了生物愈合的过程。
• 机器人从简单的直线运动开始,逐渐演变成三维结构,无需人工干预• 像三角形和星星这样的结构是通过爬行、折叠和合并形成的——这些过程在数千次随机模拟中近一半的模拟中都有发生• 与传统的模块化机器人不同,这些机器人不需要外部工具或新部件来重新配置
由麻省理工学院(MIT)和哈佛大学的科学家领导的研究团队,通过物理实验和计算机模拟对这一概念进行了测试,以确定哪些形态可以自主出现。
**重要性:**当前的机器人是为特定任务而设计的,一旦条件发生变化就会失效。这种“机器人新陈代谢”方法可以使机器适应新地形、从损坏中恢复,并发展出我们未曾编程的能力。对于太空探索、灾难响应以及人类无法进行维修的环境而言,能够利用现有材料进行自我重建的机器人可能会带来变革性的影响。
🎬 ChatGPT智能体进入行动时代
img
来源:OpenAI
ChatGPT首次真正能为你完成工作。OpenAI的新代理模式可利用其自身的虚拟计算机自主完成任务。你可以让它分析三个竞争对手并制作幻灯片,为四人规划一份日式早餐并采购必要食材,或者扫描你的日程表并根据近期新闻提供即将召开会议的简报。然后在它工作时你就可以放手不管了。
新的代理模式将三种现有工具整合到一个单一系统中,该系统可以在思考和行动之间流畅切换。它融合了Operator点击和浏览网站的能力、Deep Research综合来自多个来源信息的技能,以及ChatGPT的对话推理能力。
此前来自谷歌、Perplexity和其他竞争对手的AI智能体在处理复杂的多步骤任务时困难重重。ChatGPT智能体通过其自身的虚拟计算机运行,该计算机可访问视觉和文本浏览器、代码执行终端以及连接的应用程序,如Gmail或GitHub。
该系统在关键行业基准测试中取得了出色的成绩,常常接近或超越人类表现:
• 在人类的最后考试中达到41.6%,大致是OpenAI的o3模型性能的两倍• 在FrontierMath上达到27.4%,而之前的模型仅为6.3%• 在WebArena上达到78.2%,接近现实世界网页导航80%以上的人类基线• 在投资银行建模任务中准确率达到71.3%,显著优于Deep Research和o3
当OpenAI朝着通用自主性迈进时,竞争对手们正采取不同的方法。Reflection的阿西莫夫智能体由前谷歌研究人员开发,专注于通过摄取公司数据和留档来理解软件开发。这种对比凸显了一个根本性的分歧:OpenAI的通用工具包方法与在特定领域表现出色的专业智能体之间的差异。
以往开发通用智能体的尝试在与现实世界交互时被证明颇具挑战性。ChatGPT智能体作为OpenAI首个可执行网络操作的系统,带来了新的风险,因此需要采取全面的安全措施,包括在执行重大操作前获得用户明确确认、对关键任务进行主动监督,以及内置提示注入防御机制。
该工具推出时带有使用限制:专业订阅者(每月200美元)每月可获得400次查询,而高级版和团队用户则可获得40次。当前的限制包括简陋的幻灯片格式以及在欧洲经济区不可用。
img
多年来,我们一直听闻AI智能体的消息,但它们往往未能达到预期。ChatGPT智能体实际上可能能够在不同工具之间保持上下文连贯,并在实际工作中提供真正有用的结果。
OpenAI在此处的明智之举是押注于广度而非专业化。当像Reflection这样的初创公司正在训练智能体深入理解特定工作流程时,OpenAI正在打造一把瑞士军刀,能够应对你抛给它的任何任务。基准测试分数证明了这一点,但更重要的是,当任务变得复杂时,它不会崩溃。
猜一猜:那张图片是AI生成?哪张图片是真实图片?
img
上期答案公布:左边为真,右边为假
页:
[1]