多客科技 发表于 2025-11-13 05:58

AI速递 | AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网

作者:微信文章



来源:腾讯研究院
想试试 AI 自动生成问答对吗?联著问答试用通道已开启!下拉找到「阅读原文」,一键开启智能交互新体验~


生成式AI

一、65岁图灵巨头LeCun离职Meta,投身「世界模型」创业

1. Meta首席AI科学家LeCun将在未来几个月离职,与小扎因AI战略分歧正式决裂,其领导的FAIR实验室逐渐被边缘化;

2. LeCun坚信大模型无法通往AGI,AI终局是"世界模型",离职后将成立新公司专注推进世界模型研究,目前正在进行早期融资洽谈;

3. Meta今年进行超4次架构调整,将战略重心从LeCun领军的FAIR转向更快推出模型和AI产品,28岁Alexandr Wang领导全新"超级智能"团队。

https://mp.weixin.qq.com/s/sgJAu8l-4P31Wzt5dTshrw

二、AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网

1. 谷歌AI Studio神秘模型成功识别200多年前商人"天书"账本,字符错误率仅1.7%,词错误率6.5%,达到人类专家级准确度;

2. 该模型不仅准确转写,还纠正了原账本书写格式错误,通过反推计算修正了模糊重量表述,展现出抽象推理能力;

3. 测试显示模型在18世纪非十进制货币系统、荷英混杂文本等极端场景下表现出色,历史学家认为这标志AI跨越真正"理解"界限。

https://mp.weixin.qq.com/s/JqHBlGKWbhKVDPglAuwGtw

三、ElevenLabs发布Scribe v2 Realtime实时语音转文本模型

1. AI语音独角兽ElevenLabs发布Scribe v2 Realtime模型,实现150毫秒超低延迟、93.5%高准确率,覆盖90多种语言;

2. 该模型在FLEURS基准测试中针对前30种常用语言准确率达93.5%,能精准识别方言、专业术语,甚至辨别笑声类型;

3. ElevenLabs成立于2022年,目前拥有7000万用户,月均生成3000万份文档,去年融资1200万美元完成C轮后估值达33亿美元。

https://mp.weixin.qq.com/s/0Z44DWSPn0faugYjw44m1w

四、OpenAI 将推出「Group chats」群聊功能,独立于个人记忆

1. ChatGPT网页版即将推出群聊功能预览版,用户可生成链接分享,所有成员能查看之前对话记录,支持文件上传、图像生成等功能;

2. 群聊的自定义指令与个人ChatGPT设置完全独立,个人记忆功能永远不会在群聊中使用,保护用户隐私;

3. OpenAI CEO暗示需要原生支持AI的生产力套件取代Slack等工具,此举被解读为OpenAI意图获取企业对话数据以改进模型。

https://mp.weixin.qq.com/s/99C0YfCxG6UtcEOIO7H_OA

五、Lovart上线分层图像编辑!一键模版自由,设计师的福音

1. LiblibAI旗下Lovart推出"Edit Elements"分层图像编辑功能,可将像素位图一键拆分为文字、前景、背景多个图层;

2. 该功能实现从位图产物反推回图层模版,文字按段落格式返回可编辑,支持中英文识别,AI生成图片也能匹配相似字体;

3. 用户每日登陆可领取100积分,分层编辑功能目前活动期免费使用,可结合第三方AI编辑模型进行图像替换。

https://mp.weixin.qq.com/s/uQWmlVAM34ZpyEy606qXOw

六、AI生成乡村歌曲登顶Billboard榜首,AI音乐PK真人创作

1. AI生成虚拟歌手"Breaking Rust"的歌曲《Walk My Walk》登上Billboard乡村数字单曲销售榜冠军,月度听众达180万;

2. 该"歌手"Instagram粉丝超3万,但评论与粉丝大量账号具机器人特征,其流量超过多位真人乡村歌手,真人歌手Ella Langley因此失去冠军;

3. Billboard未对AI歌曲上榜制定政策规定,过去几个月至少6位AI或AI辅助艺术家出现在榜单,引发关于真人创作竞争力的担忧。

https://mp.weixin.qq.com/s/KwZ4A68UEzoipXiuegR71w

七、极佳视界最新完成一轮亿元级A1轮融资,华为参与投资

1. 物理AI公司极佳视界完成亿元级A1轮融资,由华为哈勃、华控基金联合投资,这是该公司两个月内连续完成的第三轮融资;

2. 极佳视界成立于2023年,产品覆盖自动驾驶世界模型、具身基础模型到世界模型平台全栈软硬件,已签约定点合作多家头部主机厂;

3. 核心团队来自清华、中科院等知名院校,发布了国内首个DriveDreamer自动驾驶世界模型和支持16秒超长时长的视频生成模型"视界一粟"。

https://mp.weixin.qq.com/s/JePX_1B3Pbz9cs7Jk28gKw

八、TypeScript是什么?超越Python成GitHub使用最广语言?

1. GitHub《Octoverse 2025》报告显示TypeScript以约4.2万名贡献者优势首次超越Python成为使用最广泛语言;

2. TypeScript在2025年贡献者数量增长超100万(同比增长66%),主要驱动力来自默认使用TypeScript的开发框架和AI辅助开发;

3. Python在AI和数据科学领域仍保持主导地位拥有260万贡献者(同比增长48%),Jupyter Notebook依旧是AI领域首选探索性环境。

https://mp.weixin.qq.com/s/JoiWmZbqPSp0ES1Nv6u6HQ

报告观点

九、Gamma:全面开放API,并发布首个AI PPT提示词指南

1. AI演示工具Gamma以21亿美元估值完成6800万美元B轮融资,50人团队实现年经常性收入1亿美元,人均创造ARR高达200万美元;

2. 公司全面开放API并发布100个场景化提示词指南,覆盖营销、销售、教育等垂直领域,月均生成3000万份"Gamma文档";

3. Gamma目前已积累7000万用户,其中付费用户超60万,自2023年起持续盈利且去年融资1200万美元至今分文未动。

https://mp.weixin.qq.com/s/E-OlM0oHpYaGmH0kxMMVDg

完整原文:腾讯研究院AI速递 20251113


☛被产业链“寄予厚望”,AIPC现在如何了?

☛中国新闻技联新闻信息标准化分会 2025年年会暨标准培训宣贯会顺利召开

☛RAG还是微调?用“带小抄的同事”讲透企业AI的关键选择







页: [1]
查看完整版本: AI速递 | AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网