Loading...

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

GoodNav 报道,科技媒体 marktechpost 4 月 25 日称,Meta AI 创新推出 Token-Shuffle,旨在解决自回归模型生成高分辨率图像的扩展性难题。

注:自回归模型是一种时间序列分析方法,用于预测数据序列的未来值,其核心是当前值与过去值之间存在线性关系。

自回归模型在语言生成领域表现出色,近年来也用于图像合成,但高分辨率图像合成时面临计算成本过高的问题。

图像合成需要大量 token,高分辨率图像往往需要数千个 token,这极大地增加了计算成本,导致许多基于自回归的多模态模型只能处理低分辨率图像,限制了其在精细图像生成中的应用。

虽然扩散模型在高分辨率图像生成方面表现出色,但其采样过程复杂,推理速度较慢。

Token-Shuffle 的核心机制与优势

Meta AI 的 Token-Shuffle 方法针对 token 效率问题进行优化。它通过识别多模态大语言模型

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...