Loading...

苹果探索自研多模态 AI 模型 Manzano:兼具理解与生成能力,不弱于 OpenAI GPT-4o 和谷歌 Nano Banana

GoodNav 9 月 27 日报道,苹果公司正在研发一款名为 Manzano 的新型图像模型,旨在同时实现图像理解与生成的双重能力。

目前,Manzano 仍未正式发布,也未提供演示 Demo,只有由多为华人作者撰写的预印本论文(其中包括已跳槽至 Meta 的庞若鸣),并展示了一些低分辨率的图像样例,涵盖较复杂的提示场景。

苹果探索自研多模态 AI 模型 Manzano:兼具理解与生成能力,不弱于 OpenAI GPT-4o 和谷歌 Nano Banana

苹果指出,这项双重功能一直是技术难题,导致许多开源模型在整体性能上落后于如 OpenAI 和谷歌等商业巨头的系统。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...