一周AI资讯盘点
作者:微信文章一周AI资讯
李飞飞World Labs 的 3D 世界模型发布。支持从文本、单图、多图、视频、3D布局图直接生成完整3D世界。生成后可交互式编辑、扩展与组合,可导出Gaussian splats、三角网格和视频等格式。
OpenAI发布GPT-5.1,引入“自适应推理”模式,可根据问题复杂性,自动调整处理速度。新版本提供8种风格的个性化交互,并具备同理心的回复。模型分三个版本Instant、Thinking、Pro,前两者已上线。
月之暗面发布Kimi K2 Thinking,基于“模型即Agent”的理念训练,支持“边思考、边使用工具”的能力,并在多项国际基准测试中达到SOTA水平。该模型训练成本仅460万美元,引发关注,有望迎来又一个Deepseek时刻
Meta推出Omnilingual ASR语音识别系统,目前已支持1600种语言,创新的情境学习技术,可扩展到5400种语言。Meta还将该模型和数据集开源,全面打破全球语言壁垒。Lovart 上线“元素拆分”功能,一键就能把图像拆分成文字、主体、背景等独立的图层,对每个图层可进行移动、替换、旋转、重绘、修改等操作。
页:
[1]