AI双子星同日升空:罗福莉首秀VS姚顺雨掌舵,巨头争夺最强大脑!
作者:微信文章一位95后“AI天才少女”在小米合作伙伴大会略显紧张地完成了首秀,另一位98年顶尖青年科学家则悄然坐上了腾讯首席AI科学家的位置,他们正在成为推动两家科技巨头向前的核心引擎。
2025年12月17日,科技圈里出现了不同寻常的人才同台竞技。
小米2025人车家全生态合作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉完成入职后的小米首秀。这位被誉为“95后AI才女”的技术专家,正式发布和开源最新MoE大模型MiMo-V2-Flash。
同日,腾讯升级了大模型研发架构,宣布前OpenAI研究员姚顺雨出任“CEO/总裁办公室首席AI科学家”,同时兼任新成立的AI Infra部及大语言模型部负责人。
---
01 亮相:一位略显紧张的天才少女
罗福莉的公开亮相并不张扬,但她的履历早已引人注目。
这位被称为“AI天才少女”的95后技术专家,曾就读于四川宜宾市第一中学校“清北班”,以优异成绩考入北京师范大学并被保送至北京大学深造。
在北大读硕士期间,她于2019年在人工智能领域顶级国际会议ACL上发表了8篇论文。她的职业生涯始于阿里达摩院,曾主导开发了多语言预训练模型VECO,并参与研发了MoE大模型DeepSeek-V2。
活动现场,罗福莉的表现稍显紧张,所介绍内容以技术解读为主。
她坦言,研发之初团队主要围绕三个问题展开:智能体必须有一个高效的沟通语言;如何加速智能体之间的沟通带宽;以及如何激发后训练的潜能。
02 成果:小米开源大模型的突破
罗福莉在小米首次公开亮相中,展示了小米在AI领域的最新成果——MiMo-V2-Flash大模型。
这款模型具备超强基座模型潜能,在世界级评估榜单中排到了全球开源模型的TOP2。更值得关注的是其成本与性能平衡。
罗福莉透露,该模型在低于Deepseek-V3.2成本的情况下,推理速度是其3倍。而MiMo-V2-Flash的参数量也很克制,总参数仅309B,激活参数只有15B。
她分享了一个富有洞见的观察:“2020年,中国开源模型距离世界顶尖闭源模型的代差至少有三年。如今,中国的开源模型距离世界顶尖闭源模型的差距可能仅有数月。”
03 背后:雷军的千万年薪挖角
罗福莉加入小米的过程,本身就是一则人才争夺战的典型案例。
此前有传言称,小米创始人雷军以千万年薪招揽这位DeepSeek-V2关键开发者,领导小米AI大模型团队。
当时有消息称,小米公司正在积极搭建自己的GPU万卡集群,以加大对AI大模型的投入力度。小米大模型团队在成立之初就已拥有6500张GPU资源。
对于雷军的邀约,据报道,罗福莉曾一度考虑是否加入小米。直到11月12日,她在朋友圈发文正式宣布:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来。”
小米集团合伙人、集团总裁卢伟冰在回应罗福莉加入小米的问题时透露,小米已在AI领域启动 “压强式投入”,未来五年研发投入预计将超过2000亿元。
04 变阵:腾讯架构大调整与姚顺雨上任
当罗福莉在小米展示技术成果时,腾讯也正在进行一场重大变革。
12月17日,腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化其大模型的研发体系与核心能力。
这场调整的核心人物是姚顺雨(Vinces Yao)——一位比罗福莉更年轻的98年AI顶尖青年科学家。他不仅出任“CEO/总裁办公室首席AI科学家”,直接向腾讯总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人。
这一配置意味着,在腾讯的战略棋盘中,姚顺雨一手抓算法,一手抓算力基建,同时直通公司最高决策层,将大模型的研究与工程落地深度耦合。
05 履历:清华姚班到OpenAI的顶尖路径
姚顺雨的学术背景同样耀眼。
他本科毕业于清华大学计算机系(姚班),后赴普林斯顿大学攻读计算机科学博士学位。2024年8月,姚顺雨加入OpenAI,参与了Operator与Deep Research这两款智能体产品的开发。
他的学术研究在大模型领域有着重要影响:提出了思维树(Tree of Thoughts, ToT)框架,通过让大模型进行多路径推理和反复思考,大幅提升了模型解决复杂问题的能力。
他还是SWE-bench(大模型代码能力评估数据集)和SWE-agent(开源AI智能体)的关键贡献者,并参与了ReAct和CoALA等开创性工作。
今年5月,姚顺雨以最年轻入选者身份跻身《麻省理工科技评论》“35岁以下科技创新35人”中国区名单。
06 策略:腾讯AI为何要迎头赶上?
腾讯此次架构调整和人事任命,背后有着深刻的战略考量。
在姚顺雨10月发布的观点中,他认为“AI发展的重心应从单纯的训练转向定义问题与评估”,提出要像产品经理一样思考“解决什么问题”,认为在当前阶段评估比训练更为重要。
这与腾讯面临的现实挑战密切相关。尽管腾讯在内部有超过900款应用和场景中落地了混元大模型,但其大语言模型在行业基准测试中并不在第一梯队。
一个标志性事件是,今年2月腾讯元宝率先接入DeepSeek R1。虽然这一动作让元宝的活跃用户数实现了数量级跃升,但也给腾讯内部敲响了警钟:自有模型的缺位,导致内部部分业务团队因混元竞争力不足而犹豫是否接入。
姚顺雨加入腾讯后,不仅建立了新模型团队,还帮助混元招募到了来自字节、阿里及其他AI公司的数位核心员工。他推动的变革很快显现成果——12月5日,腾讯发布了全新的大模型HY 2.0,显著改进了预训练数据和强化学习策略。
07 转向:小米为何改变AI战略?
小米对大模型的战略,经历了从观望到全力投入的明显转变。
2023年5月底,小米集团总裁卢伟冰曾在财报会上明确表示,小米不会做OpenAI类的大模型。但到了2024年年底,业内传出消息,称小米正着手搭建自己的GPU万卡集群。
这一转变的背景是,国内大模型竞争已经从“卷参数”进入到“卷落地应用”的“下半程”。而小米面临手机存储成本上涨和汽车毛利率可能下滑的双重压力,需要寻找新的增长动能。
“要坐稳头部厂商位置,除了守好手机和汽车业务的‘护城河’,AGI这条河也要蹚过,而自研大模型就成为不可省略的一步。”
在罗福莉看来,下一代智能体系统不是“语言模拟器”,而是一个真正理解人类世界,并与之共存的“智能体”,应具备从“回答问题”到“完成任务”的转变能力。
08 竞赛:从人才争夺到落地应用
罗福莉和姚顺雨的同日亮相,折射出当下AI领域人才竞争的激烈程度。脉脉《2025年AI人才流动报告》显示,1—7月AI领域人才市场供需两旺,AI新发岗位量同比增长超10倍。
在这场人才战中,腾讯一改往日在大模型人才战中的守势,开始以双倍薪资从竞争对手处挖角核心研究员,并为应届博士生开出高出行业标准50%的薪资溢价。
小米则通过高薪邀请罗福莉加入,展现了其对顶尖AI人才的渴望。卢伟冰直言:“小米非常渴望人才、尊重人才,也希望能够给优秀的人才提供好的发展平台。”
除了人才,组织架构的调整同样关键。腾讯此次新成立的AI Infra部将负责大模型训练和推理平台技术能力建设,AI Data部则专注于大模型数据及评测体系建设。
---
一位业界观察者评论:“罗福莉和姚顺雨代表了中国AI人才的两个典型路径——本土深耕与国际视野。她们的同日亮相绝非巧合,背后是小米和腾讯对AI战略地位的空前重视。”
在腾讯内部,超过90%的工程师使用腾讯云代码助手CodeBuddy,50%的新增代码由AI辅助生成。
另一边,罗福莉站在小米大会舞台上,略显紧张地介绍着MiMo-V2-Flash大模型:“真正的护城河是科学的研究文化与方法,将未知问题结合模型优化转化为可用产品的能力。”
两场发布,两个方向,一个共识——中国的AI竞争已经进入全新阶段,而掌握顶尖人才的公司,才可能在这场全球科技竞赛中赢得未来。
页:
[1]