Loading...

百度发布自研视频生成模型 MuseSteamer:一张图即可生成电影级高清有声视频

GoodNav 7月2日消息,百度商业研发团队发布了自主研发的视频生成模型“MuseSteamer”和创作平台“绘想”。MuseSteamer 是全球首个实现中文音视频一体化生成的视频模型,它能够协同创作画面、音效和人声台词,从而打破了传统AI视频生成“先画面后配音”的局限。

MuseSteamer 在权威榜单 VBench I2V 中以89.38% 的总分荣登全球榜首。它支持一张图片生成10秒1080p电影级画质视频,人物微表情和镜头效果达到专业影视水准。该模型的核心能力源于对数亿中文多模态数据的清洗、精细化的视频结构化描述语言以及多目标强化学习等技术优化。

MuseSteamer 模型包含 Turbo、Lite、Pro 和全系列有声版,覆盖了从普通创作者到专业影视机构的各种需求。其中,Turbo 版已在绘想平台上线,开启限时免费测试;其余版本将于8月陆续开放。平台同时启动“跨次元捏合”AI视频创作大赛,用户只需上传一张图片即可生成动态捏捏乐视频参赛。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...