找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 214|回复: 0

【AI企业动态】高通启动 “AI 加速计划”;英伟达开源 Audio2Face;OpenAI 测试 GPT-5 智能体

[复制链接]
发表于 2025-9-26 06:16 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
w1.jpg

高通启动 “AI 加速计划”:三十年生态积淀,引爆边缘智能规模化浪潮

2025 骁龙峰会・中国启幕之际,高通联合 GTI、三大运营商及小米、荣耀等产业链伙伴启动 “AI 加速计划”,高通中国区董事长孟樸直言,这是继 3G 到 5G 技术迭代后,与中国生态的又一次战略协同。该计划锚定个人 AI、物理 AI、工业 AI 三大趋势,以 “芯片 - 算法 - 场景” 深度融合为核心,推动终端侧 AI 跨设备、跨行业落地。

w2.jpg

高通公司中国区董事长孟樸

依托骁龙平台的技术积累,高通已在智能终端领域构建完整产品矩阵,仅汽车赛道就通过骁龙数字底盘支撑 210 多款中国车型落地。

w3.jpg

此次计划更强化边缘智能能力 —— 结合 5G-A 与流匹配模型技术,实现终端侧多模态数据的实时处理,张亚勤院士评价称,这正契合 “AI 向边缘渗透” 的产业大趋势。现场展示的百余项技术突破中,手机与 XR 设备的 AI 协同交互、工业传感器的实时智能分析等场景,已显现规模化潜力。

w4.jpg

高通公司总裁兼CEO安蒙表示六大趋势正在驱动AI未来的发展

苹果发布 SimpleFold:流匹配技术颠覆蛋白质预测,计算成本大降

苹果推出轻量级蛋白质折叠预测 AI 模型 SimpleFold,以流匹配技术突破传统模型的计算瓶颈,在保持高精度的同时将运算成本大幅降低。与谷歌 AlphaFold 依赖复杂去噪流程不同,该模型通过学习平滑数据转换路径,直接实现从随机噪声到蛋白质结构的生成,跳过大量冗余计算步骤。

w5.jpg

SimpleFold 提供 1 亿至 30 亿参数的多规模版本,在 CAMEO22 和 CASP14 两大权威基准测试中表现亮眼,且参数规模与预测性能呈现稳定正相关,30 亿参数版本在复杂蛋白结构预测中优势显著。苹果研究团队强调,该模型已在 arXiv 开放学术资源,旨在为药物研发、新材料设计等领域提供高效工具,标志着苹果 AI 正式切入生物科技赛道。

英伟达开源 Audio2Face:实时面部动画技术,重构虚拟角色生产链

英伟达宣布开源生成式 AI 面部动画模型 Audio2Face,同步开放 SDK 及完整训练框架,以 “音频驱动动画” 技术革新游戏、影视等领域的内容生产流程。该模型可精准解析音频中的音素与语调特征,实时生成口型同步、情感匹配的面部动画,支持离线渲染与实时交互两种核心模式。

w6.jpg

在游戏场景中,Survios 利用其简化《异形:侠盗入侵进化版》的面部捕捉流程,Farm 51 更在《切尔诺贝利人 2》中实现 “音频直出细腻动画”,使角色真实感与开发效率双重提升。影视制作与虚拟客服领域的测试显示,该技术可将面部动画制作周期缩短 40%,且兼容主流 3D 建模工具,降低行业接入门槛。

OpenAI 测试 GPT-5 智能体:双模能力突破,7 小时自主完成代码重构

OpenAI 披露新一代 AI 智能体测试进展,基于 GPT-5 打造的 Codex 专项版本实现多领域任务处理突破,其 “即时协作 + 独立执行” 双模特性重新定义 AI 编程效率。在软件开发场景中,该智能体可实时响应简单 Bug 修复需求,更能连续 7 小时自主推进大规模跨文件重构。

w7.jpg

核心升级体现在动态资源分配机制:面对低负载请求时 token 消耗量减少 93.7%,复杂任务则自动延长推理时间,代码重构准确率达 51.3%,远超 GPT-5 基础版的 33.9%。内部工具 “Code Review Agent” 已实现 PR 审查零遗漏,高影响力评论占比从 39.4% 提升至 52.4%,推动 AI 从辅助工具向 “工程伙伴” 升级。

OpenAI 砸万亿建算力帝国:得州超级中心落地,算力暴涨 13 倍

OpenAI 启动全球最大规模算力扩张计划,总投资达 1 万亿美元,标志着行业从 “模型竞赛” 迈入 “基建军备赛” 阶段。核心项目位于得州阿比林的计算中心占地 1100 英亩(相当于纽约中央公园),建成后算力将达现有规模的 13 倍以上,成为 “全球最大 AI 超算中心”。

w8.jpg

此次扩张依托三重合作保障:与英伟达达成 1000 亿美元硬件供应协议,联合甲骨文、软银新建 5 座数据中心,同时扩建现有设施。OpenAI 明确从 “模型驱动” 转向 “算力驱动”,此举既为 GPT-6 等下一代模型研发铺路,更试图构建算力壁垒 —— 华尔街日报分析称,这可能重塑全球 AI 算力分布格局。

OpenAI 腹背受敌:微软 Copilot 开放 Anthropic 模型,垄断地位松动

微软打破对 OpenAI 的 “独宠”,宣布 Microsoft 365 Copilot 全面接入 Anthropic 的 Claude Sonnet 4 与 Opus 4.1 模型,商业客户首次可自由切换 AI 引擎。在 Researcher 工具中,用户点击 “Try Claude” 即可调用 Anthropic 模型处理深度推理任务,Copilot Studio 更支持混合使用多厂商模型构建智能体。

w9.jpg

w10.jpg

微软业务总裁 Lamanna 强调,此举是为满足企业多样化需求 ——Claude 模型在长文本分析、合规性输出上的优势,可与 OpenAI 模型形成互补。业内认为,这标志着 AI 生态从 “独家绑定” 转向 “多元竞争”,OpenAI 需在模型性能与场景适配性上进一步突破以稳固地位。

联想 “全栈 AI” 亮相云栖:混合式架构锚定三大算力场景

2025 云栖大会上,联想以 “混合式 AI 让 AI 成为创新生产力” 为主题,展出覆盖终端、基建、解决方案的全栈 AI 布局,重点聚焦企业级训练、边缘推理、跨端协同三大核心场景。其 AI 基础设施通过 “云 - 边 - 端” 算力调度技术,可适配从车间传感器实时分析到数据中心大模型训练的多维度需求。

w11.jpg

现场展示的制造业解决方案中,联想 AI 终端与边缘服务器协同,将设备故障预警响应时间缩短至秒级;企业级算力集群则通过液冷技术实现 PUE 低至 1.08,兼顾性能与能效。联想强调,全栈能力源于硬件研发与生态合作的双重积累,目前已服务超 500 家制造企业的智能化转型。

天猫精灵酒店 4.0 落地:AI 智能体化身 “全能员工”,服务效率提升 3 倍

阿里发布天猫精灵酒店 4.0 系统,内置多模态 AI 智能体实现从客房服务到运营管理的全流程介入,成为酒店行业的 “新员工” 标配。该智能体通过语音交互、环境感知双引擎,可响应 “调节窗帘亮度”“补充洗漱用品” 等客房需求,响应延迟低于 0.8 秒。

w12.jpg

在后台管理端,智能体可自动统计客房能耗、预测物资消耗,某试点酒店数据显示,其使前台响应效率提升 3 倍,布草损耗率降低 15%。系统还支持个性化服务定制,能根据住客历史偏好自动调整空调温度与灯光模式,推动酒店从标准化服务向 “千人千面” 体验升级。

阿里云 AI 全栈自研卡位:生态战成行业竞争核心

阿里云在云栖大会披露 AI 技术战略,以 “芯片 - 框架 - 模型 - 应用” 全栈自研构建壁垒,强调系统生态协同已成下一阶段竞争关键。其自研芯片通过先进封装技术弥补制程差距,搭配飞天操作系统的算力调度能力,使大模型训练效率较通用架构提升 40%。

w13.jpg

在模型层,通义千问系列已衍生 17 万个行业模型,覆盖金融、医疗等 20 多个领域;应用层则通过 API 市场接入超 30 万开发者。行业分析指出,阿里云正复制 “操作系统 + 生态” 的成功路径,通过降低企业接入成本扩大市场份额,与腾讯、百度等对手形成差异化竞争。

阿里夸克发布 “造点”:Midjourney + 通义万相,实现电影级音画生成

阿里夸克推出 AI 创作平台 “造点”,首次整合 Midjourney V7 与通义万相 Wan2.5 双模型能力,打造 “生图 - 生视频” 一站式创作体验。依托通义万相的音画同步技术,平台可生成 10 秒 1080P 高清视频,自动匹配人声、音效与画面节奏,支持运镜、角色互动等复杂指令控制。

w14.jpg

生图功能则覆盖多图参考、风格代码等专业需求,在亚洲人像、国风元素生成上表现突出,内测期间诞生 “文物吃月饼” 等爆款作品。用户可通过 PC 端专业工具或 APP 轻量化功能创作,即日起至 9 月 30 日可免费体验视频生成能力,目前已吸引超 10 万专业创作者入驻。

可灵 2.5 Turbo 上线:动态效果跃升 36%,视频生成成本大降

可灵 AI 推出 2.5 Turbo 视频生成模型,在文本理解、动态效果双维度实现突破,1080P 画质 5 秒视频生成成本较前代降低 30%。新模型可精准解析多步骤因果指令,在打斗、群舞等大动态场景中,物理运动模拟流畅度显著提升,GSB 专业评测得分达 2.89,远超 Veo3-fast 等竞品。

w15.jpg

风格保持能力也实现升级,能精准复刻参考图的色彩影调与笔触质感,光影构图的美学表现更贴近专业创作标准。目前该模型已适配影视短剧、游戏动画等场景,某短剧团队反馈,其使单集制作周期从 3 天缩短至 8 小时,推动内容生产效率革命。

w16.jpg

亚马逊 Zoox 加速无人驾驶落地:规模化部署挑战谷歌主导地位

亚马逊旗下自动驾驶公司 Zoox 启动无人驾驶汽车大规模部署计划,首批车队将在加州硅谷、得州奥斯汀开展商业化运营,直接挑战谷歌 Waymo 的市场主导地位。其 L4 级自动驾驶系统采用双向行驶设计,搭载多模态感知融合技术,可应对暴雨、强光等复杂天气场景。

Zoox 强调已解决 “成本 - 安全” 核心矛盾,通过自研芯片与算法优化,使单车制造成本降至传统车型的 1.2 倍。目前已获得美国 4 个州的运营许可,计划 2026 年覆盖 20 个城市,与 Uber 达成的运力合作协议,将进一步加速其商业化进程。



w18.jpg
点击上方“二维码”关注我们
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-10-2 11:52 , Processed in 0.150776 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表