苹果探索自研多模态 AI 模型 Manzano:兼具理解与生成能力,不弱于 OpenAI GPT-4o 和谷歌 Nano Banana
GoodNav 9 月 27 日报道,苹果公司正在研发一款名为 Manzano 的新型图像模型,旨在同时实现图像理解与生成的双重能力。
目前,Manzano 仍未正式发布,也未提供演示 Demo,只有由多为华人作者撰写的预印本论文(其中包括已跳槽至 Meta 的庞若鸣),并展示了一些低分辨率的图像样例,涵盖较复杂的提示场景。
苹果指出,这项双重功能一直是技术难题,导致许多开源模型在整体性能上落后于如 OpenAI 和谷歌等商业巨头的系统。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...