百度发布自研视频生成模型 MuseSteamer:一张图即可生成电影级高清有声视频
GoodNav 7月2日消息,百度商业研发团队发布了自主研发的视频生成模型“MuseSteamer”和创作平台“绘想”。MuseSteamer 是全球首个实现中文音视频一体化生成的视频模型,它能够协同创作画面、音效和人声台词,从而打破了传统AI视频生成“先画面后配音”的局限。
MuseSteamer 在权威榜单 VBench I2V 中以89.38% 的总分荣登全球榜首。它支持一张图片生成10秒1080p电影级画质视频,人物微表情和镜头效果达到专业影视水准。该模型的核心能力源于对数亿中文多模态数据的清洗、精细化的视频结构化描述语言以及多目标强化学习等技术优化。
MuseSteamer 模型包含 Turbo、Lite、Pro 和全系列有声版,覆盖了从普通创作者到专业影视机构的各种需求。其中,Turbo 版已在绘想平台上线,开启限时免费测试;其余版本将于8月陆续开放。平台同时启动“跨次元捏合”AI视频创作大赛,用户只需上传一张图片即可生成动态捏捏乐视频参赛。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...