标签:大模型
12GB 显存可实现 128K 上下文 5 并发会话,IBM 预览 Granite 4.0 Tiny 模型
5 月 10 日消息,IBM 本月 2 日介绍了其 Granite 4.0 系列模型中的最小版本之一:Granite 4.0 Tiny 的预览版本。
Mistral 发布 Medium 3 大模型:前沿级性能与低成本兼具,提供多种企业功能
5 月 8 日消息,Mistral 当地时间 7 日推出了 Mistral 3 系列模型的中等量级版本 Medium 3,宣传其同时具有前沿级别的性能和明显更低的成本,并具备多种...
字节跳动启动 Top Seed 大模型顶尖人才计划 2026 届校招,计划招募 30 位顶尖博士
4 月 27 日消息,今日,字节跳动 Seed 正式启动 2026 届 Top Seed 大模型顶尖人才校招计划。
答对有资格入职特斯拉?马斯克这道数学题,我们用七大 AI 模型测了一遍
马斯克在社交平台 X 发布了一道数学题,声称答对者可获得特斯拉公司工作机会,引发了网友热议。题目是:6÷2 (1+2)。网友对该题的解答结果呈现两极分化,一部...
迅雷功能插件升级:一键完成大模型批量下载
4 月 15 日消息,近日,迅雷上线新版本插件,针对大模型下载场景进行优化,让用户能够更快更方便地批量下载大模型所有文件,下载迅雷客户端且在浏览器安装迅...
商汤日日新 SenseNova V6 多模态融合大模型发布
4 月 10 日消息, “商汤日日新 SenseNova V6”多模态融合大模型于今日发布,具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力,支持 10 分钟的...
谷歌研究:合成数据使大模型数学推理能力提升八倍
4 月 7 日消息,最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。
中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型
4 月 7 日消息,据《科创板日报》从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导...
面壁智能 CEO 李大海:汽车比手机更适合端侧模型落地
中国电动汽车百人会论坛(2025)将于3月28日至3月30日在北京举行,主题为“夯实电动化推进智能化实现高质量发展”。面壁智能的联合创始人兼CEO李大海参与了论坛...
AMD 推出开源项目“GAIA”实现本地大模型高效运行:针对锐龙 AI 300 系列处理器优化,目前仅适用于 Windows
3 月 22 日消息,当地时间周四,AMD 宣布推出专为本地运行大语言模型(LLM)设计的应用 GAIA(发音为/ˈɡaɪ.ə/)并在 Github 开源,目前仅限于 Windows ...