AI多模态本周要闻(3.22-3.28)
作者:微信文章一、AI图像:
1、chatGPT-4o
开场王炸必须给到GPT-4o文生图功能,上线即刷屏,真正意义上的根据用户需求输出想要的图片内容和画风。用户仅需输入“手账风格”,即可生成我们平时经常看到的手账画面,社交平台相关话题阅读量破10亿。但因需求爆棚,OpenAI被迫限流免费用户每日3张生成额度。
2、AI 文生图新王者:Reve Image 1.0 登顶,低价高质挑战 Midjourney 和 Flux
新兴AI图像生成工具Reve Image 1.0凭借卓越的指令理解能力和文字渲染表现,在第三方评测中超越Midjourney等竞品登顶。
该工具支持自然语言修改图片和风格迁移,基础套餐提供100张免费额度,长期用户可享$5/500张的低价。
联合创始人表示其目标是构建人机共通的语义表达层,而非单纯追求视觉逼真。目前该工具已开放免费试用,未来或将推出API服务。
二、AI视频
1、源图生视频模型Step-Video-TI2
3月20日,阶跃星辰宣布开源图生视频模型Step-Video-TI2V,该模型是基于 30B 参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,模型效果在图生视频领域权威基准测试VBench-I2V 中达到State-of-the-Art水平,排名在全球靠前。
ComfyUI 已支持阶跃星辰图生视频模型的自定义节点(
页:
[1]