百度发布自研视频生成模型 MuseSteamer：一张图即可生成电影级高清有声视频

3.9K 0 0

GoodNav 7月2日消息，百度商业研发团队发布了自主研发的视频生成模型“MuseSteamer”和创作平台“绘想”。MuseSteamer 是全球首个实现中文音视频一体化生成的视频模型，它能够协同创作画面、音效和人声台词，从而打破了传统AI视频生成“先画面后配音”的局限。

MuseSteamer 在权威榜单 VBench I2V 中以89.38% 的总分荣登全球榜首。它支持一张图片生成10秒1080p电影级画质视频，人物微表情和镜头效果达到专业影视水准。该模型的核心能力源于对数亿中文多模态数据的清洗、精细化的视频结构化描述语言以及多目标强化学习等技术优化。

MuseSteamer 模型包含 Turbo、Lite、Pro 和全系列有声版，覆盖了从普通创作者到专业影视机构的各种需求。其中，Turbo 版已在绘想平台上线，开启限时免费测试；其余版本将于8月陆续开放。平台同时启动“跨次元捏合”AI视频创作大赛，用户只需上传一张图片即可生成动态捏捏乐视频参赛。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

2.7K

GoodNav.net

4.8K

GoodNav.net

4.4K

GoodNav.net

6.1K

GoodNav.net

4.4K

GoodNav.net

4.8K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...