AI赛事中场球员的突围
作者:微信文章我试着把所有精力投入在距离AI技术更近一些的地方。“环境很重要,任务也很重要”,27岁的姚顺雨选择从Open AI离职。从这段话中可能揣测一些原因。他说,“当你有一个差的任务时,永远学不到好东西。所以,重要的是找到一个足够有挑战的任务。这个任务能够作出新的,简单的,通用的东西。”
深以为然。
最近,有一种时间上的紧迫感。在新加坡的三年又三个月,陷入一种毫无意义的自怨自怜。彼时彼刻,Open AI、DeepSeek接连爆发,技术热点改朝换代、天翻地覆。AI一天,人间一年。再回国工作,和世界脱轨了。大模型,Agent变成各公司最热的部门。众星捧月一般,被各种乙方团队包围。我一个新人,挤不进去。那就向更深处挖掘。大模型之下,还有AI Infra。这是一个较新的领域,大名鼎鼎的AlphaGo出现前,并不存在。
Google的诞生带来了工业界的第一次极限挑战。我们看到的是Google白色界面永恒不变的搜索小框。事实上,越是新的,简单的,通用的东西,背后的工程越复杂。如何可靠、高效的在超大规模分布式集群中并行处理海量简单任务?Google靠从零到一自建Infra团队解决了这个世界级难题。AlphaGo后,Infra派生出AI Infra这个分支。而ChatGPT的火爆让AI Infra成为有野心有实力投入AI公司之标配。AI Infra,介于芯片之上,大模型之下。“我们团队的工作如同足球场上的中场球员,致力于将高质量的“传球”精准输送至前锋——也就是前方的运营与算法团队”,AI Infra团队主管Z过于自谦。齐达内就是中场球员,传奇又著名。拉长时间来看,为泛化工具贡献力量的每一个人,都是赢家。在这个数据驱动的时代,用户打开我司App后的每一个动作都与AI Infra的工作紧密相连。通过持续的模型训练与推理,App变得越来越懂用户,不断生成有价值的洞察。这些洞察进一步赋能搜索、推荐、广告、视觉、文本等多个关键场景,助力它们更精准地为用户提供个性化的内容与服务。
Z说,一个好的AI Infra人才既要懂硬件芯片,又要懂模型,还要会工程。“只有对上下游都极致了解,也可以影响两边发展的人,才能真正做好AI Infra的工程“。只不过,鲜花、掌声与荣誉确实与这帮人有一定距离。芯片人才是国之重器。大模型新星如姚顺雨传言薪酬过亿。但很少在媒体上看到AI Infra的吸睛新闻。全球AI Infra领域做得比较成功的StartUp,比如Together.ai,Fireworks.ai 估值仅仅40亿美金左右。
“总需要有人去干最累最脏的活儿。”导师C在清华研究AI Infra。他有五个博士在我司,围绕x LLM做实习研究,“这个领域,有点类似传统的数据库,重要又基础,没了它也不行”。xLLM是一个大模型推理引擎。技术同学对这个东西的定义为“中枢神经”,想象一下,物理世界有一座机房,里面无数GPU芯片用网络连接起来,变成超级Agent,像一个虚拟千手观音,用各种类型的AI能力,落地人类千千万万需求,让生活更美好。其中,xLLM的价值是,让“千手观音”调用大模型使用超贵的GPU时,效率更高,成本更低。能省多少钱?一万张卡和十万张卡遇到的问题是不一样的。业界有一个说法,想要做最优秀的事情就需要有最优秀的AI Infra团队。只是,擅长向上向下垂直整合的AI Infra团队很难单独证明价值。成熟牛马权衡利益。才华横溢的年轻人只看兴趣。C老师的博士们,每季度有一次汇报。每人五分钟,介绍在xLLM项目中的工作。陪着技术主管,面对着他们坐着。秋日暖阳透过锃亮的玻璃窗洒进办公室,照在青春洋溢的脸上,仿佛给他们打上一层金边。听着他们正经危坐在主讲台,声音微微颤抖地讲述各自的探索与困惑。我心想,这些超级聪明的中国年轻男孩,到底知道不知道自己选择的这个方向意味着什么?也许,他们并不认为,自己在做的事情,自己和身边这群人,正是走出中国特色AI Infra之路的关键。最重要的永远是方向的选择。AI Infra行业很新,xLLM也很新,但从跟随国际开源框架到定义新一代推理标准,xLLM也许算得上中国AI技术自主化进程中,插在《
国务院关于深入实施“人工智能+”行动的意见(2025年11号)》中的一面小旗,为“加快研究更加高效的模型训练和推理方法,积极推动理论创新、技术创新、工程创新协同发展”贡献微薄力量。工作有时就像一场足球赛,最重要的是找准自己在团队中的位置,理解自己的角色与价值,能够承上启下、协调左右是一种难得的能力。很多时候,中场球员的任务确实并非直接进球,甚至明知这脚球无法破门,也要全力以赴地奔跑、传球、防守,因为只有保持团队的运转与协作,不轻易放弃,机会才可能在某个不经意时刻出现。开源也许算AI Infra团队的上佳契机。让他们在公司业务之外,能在一个更广阔的舞台上实现自我价值并拓展合作伙伴。8月23日xLLM上线GitHub,没有任何传播出街。我想看看这个项目在技术社区的口碑和自然生长力。仅仅一个月,广东联通以及南京、杭州的计算中心开始部署xLLM到他们的生产环境。GitHub Star 246个(截至2025年9月23日)。这一切给了我底气,在今年的JDD大会上把他们正式介绍给公众和媒体。相信在各种场景的大量实践、犯错、迭代后,xLLM一定会变得越来越好,越来越流行。而这一切还只是刚刚开始。从芯片到框架,从模型到应用,一个完整的国产AI技术栈正在成型,让我们给中国技术再多一些时间。
页:
[1]