AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成
GoodNav 11 月 8 日报道,AMD 在 10 月 31 日发布的一篇博文中,宣布推出其首个完全开放的 10 亿参数语言模型系列 AMD OLMo,旨在为开发者及研究人员提供强大的 AI 研究工具。
AMD OLMo 模型是由 10 亿参数的语言模型系列(LMs)从零开始训练而成,在 AMD Instinct™ MI250 GPU 集群上进行训练,利用了超过 1.3 万亿个 tokens 进行预训练,赋予模型在自然语言任务中的卓越推理能力。
根据新闻稿信息,OLMo 模型采用解码器(decoder-only)架构,并通过下一个标记预测(next-token prediction)进行训练,该架构在文本生成和上下文理解方面表现出色。
与其他开源模型相比,AMD OLMo 在推理和对话能力上表现杰出。特别是在多个基准测试中,其性能与最新的 OLMo 模型相当,而计算需求仅为其一半。
除了在数据中心使用外,OLMo 还支持配备 NPU(神经处理单元)的 AMD Ryzen AI PC 进行模型部署,使开发者能够在个人设备上实现 AI 功能。
AMD OLMo 是完全开源的,意味着其他开发者和公司可以自由使用及修改这些模型,为探索 AI 技术替代方案的企业提供了一个有效选择。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...