新闻 发表于 2025-12-31 09:21

生数科技获评创业黑马2025年度AI商业价值企业,以第一性原理重塑AI叙事新范式

作者:微信文章
12月28日,由创业黑马主办的 “第 17 届创业家年会” 在北京顺利召开。年会上正式揭晓了「2025年度AI商业价值企业」,生数科技凭借在多模态领域的全球引领性技术与成熟的商业化成果成功入选。



生数科技CEO骆怡航博士出席了会议,并带来了关于多模态AI重塑内容产业的变革和机遇的深度洞察。

骆怡航博士表示,2025年行业发生了深刻变革,AI视频从玩具向生产力工具转变,Vidu Q2模型实现了从生成视频到生成演技的跃迁,创作门槛持续降低,从生成镜头片段到Vidu Agent一键成片,AI视频内容在商业领域也全面开花,已广泛应用于互联网、广告、电商、短剧、动漫、影视,文旅、教育等8大行业。



在用户层面,过去一年Vidu用户增长迅猛,Vidu已服务全球超4000万用户和10000+开发者与企业客户,累计生成视频数量超5亿条,其中商业内容素材生成量占比超70%。

成立3年以来,Vidu始终从第一性原理出发思考未来终极的创作范式,去年Vidu在全球首发了参考生视频功能,重塑AI叙事新范式,视频生成真正迈入智能推理时刻。

目前在Vidu平台上,创作者上传的自有主体资产超过200万个,共享主体近10万个,每天创作者通过主体库+参考生视频创作的镜头超过100万个。正如Vidu超创所言,Vidu参考生视频让创作团队从堆砌生图和抽卡的劳动密集型升级为资产加分镜加剪辑驱动的创作密集型。

展望未来,Vidu将持续提供全球内容生产力,激发每个人和每个组织的想象力和创造力,与此同时,Vidu也将从多模态大模型向世界模型、物理世界交互延展,创造无限可能。



从“玩具”到“核心生产力”的产业跃迁

回顾 2024年,AI视频发展还很不成熟,很多时候更像是玩具。很多生成的视频看起来就是一眼AI,经常会出现崩坏等情况,实际上这并不能称之为产品或者工具。去年AI视频有很多特效模版可以玩,但是无法真正应用到实际商业化场景中,广告、短剧、影视等商业应用领域最关心的一致性问题仍未得到有效解决,无法保持长片段的主体一致性。同时一些AI视频生成一个 5 秒或者8 秒的片段,需要数分钟才能完成,抽卡成功率非常低。这是 2024 年我们看到的技术到产业落地非常现实的一个情况。



到了2025年行业逐渐走向成熟。我们看到AI视频平台已经从玩具变成了生产力工具,内容创作者已经可以用我们多模态大模型产品Vidu做出非常精彩的片段,AI生成的视频在情绪表演、科幻、高速运动、专业特效、运镜切镜、动态打斗、多元风格等方面,已经非常接近某个细分方向对商业级、专业级的视频内容要求。



除了一些片段镜头之外, AI 短片、AI长片已经进入到大众视野,大家现在在平台上看到的一些漫剧、广告背后很多是通过 AI 视频来实现的。即使在挑战难度较大的AI真人短剧方向,AI视频也非常接近真人实拍的标准。



以第一性原理重塑AI叙事新范式

所有的视频背后都有不同的创作者,不同的故事,而Vidu参考生视频打开了内容叙事新范式。

早期的 AI 创作范式包括文生视频、图生视频,其实这些视频创作方式均有局限,Vidu从技术和产品层上提出了主体库加参考生的创作范式,所有的角色、道具、场景、风格等都可以作为参考去生成视频。这些主体也是我们在传统的拍摄过程中所要沉淀的创意资产,现在利用Vidu可以使这些核心资产被极大复用,可以是人+道具+场景,人+场景+特效+招式等不同的排列组合,以实现无限想象的创作。图生视频和文生视频无法生成的镜头,参考生视频都可以实现。

引用我们Vidu的超创以及首席讲师冰皓的一句话,这句话非常能代表我们的用户痛点,以及在使用当前视频生成技术里边需要改变的一个方向。他认为参考生视频是让创作团队从堆砌生图和抽卡的劳动密集型升级为资产加分镜加剪辑驱动的创作密集型,同时因为主体即资产、分镜即创作的这样一个模式,它让AI创作者可以回归影视创作的本质,那就是“叙事"和"审美",这两者其实是 AI 代替不了人类的,也是人的核心价值。

为什么生数科技可以做出领先的模型技术和产品Vidu?

参考生视频的技术难度在于需要理解不同的输入,输入信息包括不同类别和数量主体、提示词,它是一个复杂的输入信息。这些输入需要模型深度去理解它的语义信息、相互之间的关联以及世界规律等。同时它需要在时间和空间的维度融合统一去生成,它不是像之前Lora 微调这种方式,它是直接输入,即刻生成,所以在我们看来这是视频生成的智能推理时刻。

在2024 年4 月我们发布了Vidu 1.0模型,此后我们不断迭代视频生成的智能推理技术,目前已经迭代了 5 个大的版本。目前Vidu参考生视频支持全球最复杂的输入,包括人物、场景、特效、线稿,未来我们还会支持音频、视频等输入,可以输入 7 个主体和提示词去生成视频。在这样的创作范式下,做到全球最快生成速度,20秒直出5秒 1080P 高清视频片段,同时我们的单镜头支持无限延长。



关于生数科技

生数科技创立于 2023 年,起步于清华人工智能实验室计算机系,具备深厚的技术积累,我们最早提出了 U-ViT 架构,早于 OpenAI Sora 采用的 DiT 架构。经过了近三年快速发展,公司搭建了完整的产品、平台、商业化体系。

在公司发展过程中,我们始终用第一性原理去思考未来最终极的创作范式,由此打造了全球创新的参考生视频技术和产品优势。

实际上生数科技从成立第一天起,我们的愿景就是希望Vidu模型和平台产品一起为整个全球的内容生产力服务,激发每个人和每个组织的想象力和创造力。

往期

推荐

RECOMMENDED





页: [1]
查看完整版本: 生数科技获评创业黑马2025年度AI商业价值企业,以第一性原理重塑AI叙事新范式