Meta 开源 MobileLLM-R1 系列小语言 AI 模型:参数量不到 10 亿、专攻数学编程科学问题
GoodNav 报道,Meta 发布了 MobileLLM-R1 系列轻量级语言模型,包含 1.4 亿、3.6 亿和 9.5 亿参数版本,专为移动设备等资源受限环境设计。
Meta 指出,MobileLLM-R1 并非通用聊天机器人模型,而是通过监督微调(SFT)训练,主要用于处理数学、编程(如 Python、C++)和科学问题。以最大的 9.5 亿参数版本为例,其预训练数据仅约 2TB 高质量 token,总训练数据量不到 5TB。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...