美团发布高效推理模型 LongCat-Flash-Thinking,达到 SOTA 水平
GoodNav 9月22日消息,美团LongCat团队发布了新一代高效推理模型LongCat-Flash-Thinking。
新模型在保持LongCat-Flash-Chat高速性能的基础上,更强大、更专业。评估结果显示,LongCat-Flash-Thinking在逻辑、数学、代码和智能体等多个推理领域,达到了业界领先水平(SOTA)。
LongCat-Flash-Thinking不仅提升了智能体自主调用工具的能力,还扩展了形式化定理证明功能,成为国内首个结合“深度思考+工具调用”和“非形式化+形式化”推理能力的大语言模型。团队发现,尤其在高度复杂的数学、代码和智能体任务处理方面,LongCat-Flash-Thinking表现出显著优势。
创新架构,实现高效推理与稳定训练:
领域并行强化学习训练方法:为了提升强化学习混合训练的稳定性,团队设计了一种领域并行方案,将STEM
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...