近期AI资讯一览
作者:微信文章01
♪
逗逗AI 1.0发布:为了实现HER中的AI陪伴体验,我们做了三件事
逗逗AI 1.0版本正式上线。打造“陪你游戏的AI伙伴”,通过无扰陪伴、实时感知和长效记忆三大创新功能,为用户提供深度陪伴体验。逗逗AI采用桌宠和悬浮球双模式,支持实时语音交互,具备视觉和听觉感知能力,能将多模态信息融合为场景记忆。
来源:逗逗游戏伙伴
02
♪
腾讯AI Lab团队推出的多模态音频生成工具AudioGenie
腾讯团队提出了一种全新的多智能体框架AudioGenie,用于从多模态输入(如视频、文本、图像)生成多样化且上下文对齐的音频类型(如音效、语音、音乐和歌曲)。采用双层架构,包含生成团队和监督团队。
来源:AI工具集
03
♪
智元机器人全系产品正式开售!领衔人机共生新时代
智元机器人宣布其全系产品正式开售,涵盖六大机器人产品线。精灵G1通用具身智能机器人售价45万元,具备高质量数据集和软硬件开发支持,适用于科研教育、数据采集和垂域场景训练。智元远征A2青春版售价16.8万元,具备文娱表演、展厅讲解等功能。
来源:智元机器人
04
♪
上交投资的首家语音大模型宇生月伴完成数千万元融资
情感语音交互模型初创公司宇生月伴完成新一轮融资,由靖亚资本和小苗朗程领投,上海交大母基金跟投。本轮融资将用于语音模型优化、产品矩阵拓展及国际化商业落地。
来源:Z Finance
05
♪
昆仑万维发布最新AI音乐模型——Mureka V7
昆仑万维发布AI音乐模型Mureka V7。模型通过核心技术MusiCoT(音乐思维链)实现了先规划整体音乐结构再生成细节的功能,解决了传统AI音乐模型“走一步看一步”的问题,生成的音乐作品更具连贯性和感染力。Mureka V7支持10种语言,可创作流行、摇滚等多种风格音乐,最长单曲时长5.5分钟。
来源:AI工具集
06
♪
Anthropic为Claude赋予“结束聊天”能力
Anthropic宣布为Claude Opus 4及4.1版本推出新功能,模型可在极少数情况下主动结束对话。功能针对持续性有害或辱骂性互动,如用户索取可能导致大规模暴力或恐怖行动的信息。Anthropic强调,此举旨在保护AI模型本身,同时与模型对齐和安全措施相关。
来源:IT之家
07
♪
哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦
Qwen团队推出全能图像编辑模型Qwen-Image-Edit。模型基于20B参数的Qwen-Image模型进一步训练,具备语义与外观双重编辑能力,支持中英文双语文字精准编辑,可实现原创IP创作、视角转换、风格迁移、元素增删改等功能。
来源:通义千问Qwen
08
♪
淘天集团发布首个 3D 动作游戏专用 VLA 模型
淘天集团未来生活实验室团队发布了首个3D动作游戏专用的视觉-语言-动作(VLA)模型CombatVLA,模型在动作角色扮演游戏的战斗任务中,成功率超越了人类玩家和GPT-4o。CombatVLA基于3B参数规模,通过动作追踪器收集的视频-动作对进行训练,采用渐进式学习范式,逐步从视频级到帧级优化动作生成。
来源:IT之家
09
♪
AI 助手理想同学MindGPT 3.1来了,模型即Agent,就是现在!
理想汽车旗下AI助手理想同学MindGPT 3.1升级为端到端智能体模型,引入模型即Agent功能,将智能体能力融入大模型,支持边想边搜,提升推理能力。新版本通过自主思考、调用工具、进一步推理的循环机制优化复杂任务处理,显著提高任务完成率。
来源:AI理想同学
010
♪
快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!
快手 Klear 团队推出 Klear-Reasoner 语言大模型,在 8B 模型中登顶,数学与代码推理能力突出。模型基于 Qwen3-8B-Base 打造,采用 GPPO(Gradient-Preserving Clipping Policy Optimization)算法,有效平衡训练稳定性和探索能力。
来源:快手技术
011
♪
淘宝灰度测试“AI 万能搜”新功能
淘宝正在灰度测试“AI 万能搜”新功能,功能位于淘宝 App 搜索页面,支持用户通过自然语言提问,AI 将生成包含文字、商品、图片和视频的“答案报告”,帮助解决购物攻略、口碑评测、优惠咨询等问题。
来源:IT之家
012
♪
ChatExcel获近千万天使轮融资,打造数据全链路商业闭环平台
ChatExcel团队宣布完成近千万天使轮融资,投资方为上海常垒资本和武汉东湖天使基金。ChatExcel由北京大学团队创立,是国内领先的生成式AI表格处理与数据智能体,累计服务用户超千万次。此次融资将用于加速产品研发迭代和全球化市场推广。
来源:元空AIExcel
013
♪
DeepSeek 开源新模型 V3.1,上下文长度拓展至 128K
DeepSeek宣布开源新基础模型DeepSeek-V3.1-Base。模型在Hugging Face发布后迅速冲上热门模型榜第4位。DeepSeek-V3.1-Base采用混合专家(MoE)架构,上下文长度拓展至128k,与V3版本参数量相同。
来源:AI工具集
014
♪
智谱AutoGLM上线:给每个手机都装上通用Agent
智谱AutoGLM 2.0正式上线,作为全球首个手机Agent,开创了Agent+云手机/云电脑的新技术范式,不占用用户本地设备资源,可在任何设备和场景下运行。AutoGLM 2.0由国产模型GLM-4.5和GLM-4.5V驱动,具备推理、代码与多模态能力,可完成多样化任务,如在生活场景中操作美团、京东等应用,或在办公场景中完成全流程工作。
来源:智谱
015
♪
Firecrawl融资1450万美元:AI爬虫独角兽盈利突围,百万美元悬赏“AI员工”
AI爬虫公司Firecrawl完成1450万美元A轮融资,由Nexus Venture Partners领投,Shopify首席执行官Tobias Lütke和Y Combinator跟投。Firecrawl为开发者和AI智能体提供开源网络爬虫工具,通过API提供商业支持版本。
来源:AI工具集
欢迎感兴趣的伙伴
联系我们
以科技为笔触
绘制声与光的未来图景
页:
[1]