Loading...

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

GoodNav 11 月 8 日报道,AMD 在 10 月 31 日发布的一篇博文中,宣布推出其首个完全开放的 10 亿参数语言模型系列 AMD OLMo,旨在为开发者及研究人员提供强大的 AI 研究工具。

AMD OLMo 模型是由 10 亿参数的语言模型系列(LMs)从零开始训练而成,在 AMD Instinct™ MI250 GPU 集群上进行训练,利用了超过 1.3 万亿个 tokens 进行预训练,赋予模型在自然语言任务中的卓越推理能力。

根据新闻稿信息,OLMo 模型采用解码器(decoder-only)架构,并通过下一个标记预测(next-token prediction)进行训练,该架构在文本生成和上下文理解方面表现出色。

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

与其他开源模型相比,AMD OLMo 在推理和对话能力上表现杰出。特别是在多个基准测试中,其性能与最新的 OLMo 模型相当,而计算需求仅为其一半。

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

除了在数据中心使用外,OLMo 还支持配备 NPU(神经处理单元)的 AMD Ryzen AI PC 进行模型部署,使开发者能够在个人设备上实现 AI 功能。

AMD OLMo 是完全开源的,意味着其他开发者和公司可以自由使用及修改这些模型,为探索 AI 技术替代方案的企业提供了一个有效选择。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...