阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
GoodNav 报道,阿里云今日深夜发布并开源了全新的 Qwen3-Omni、Qwen3-TTS 和 Qwen-Image-Edit-2509(类似谷歌 Nano Banana 的图像编辑工具)。
Qwen3-Omni 是业界首个原生端到端全模态 AI 模型,支持文本、图像、音频和视频输入,并能通过文本和自然语音实时流式输出结果。它解决了多模态模型在不同能力之间权衡取舍的难题。
Qwen3-Omni 作为原生端到端多语言全模态基础模型,主要特性包括:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...