标签:大模型
谷歌研究:合成数据使大模型数学推理能力提升八倍
4 月 7 日消息,最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。
中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型
4 月 7 日消息,据《科创板日报》从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导...
面壁智能 CEO 李大海:汽车比手机更适合端侧模型落地
中国电动汽车百人会论坛(2025)将于3月28日至3月30日在北京举行,主题为“夯实电动化推进智能化实现高质量发展”。面壁智能的联合创始人兼CEO李大海参与了论坛...
AMD 推出开源项目“GAIA”实现本地大模型高效运行:针对锐龙 AI 300 系列处理器优化,目前仅适用于 Windows
3 月 22 日消息,当地时间周四,AMD 宣布推出专为本地运行大语言模型(LLM)设计的应用 GAIA(发音为/ˈɡaɪ.ə/)并在 Github 开源,目前仅限于 Windows ...
阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控
3 月 20 日消息,今年 2 月阶跃星辰开源了两款 Step 系列多模态大模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,今天阶跃星辰继续开源图生视频...
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
3 月 10 日消息,字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该...
2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线
12 月 31 日消息,智谱官方今日发布 GLM-Zero 的初代版本 GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型。
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
12 月 14 日消息,阶跃星辰昨日在公众号宣布推出 Step-1o 千亿参数端到端语音大模型,据称是“国内首个千亿参数端到端语音大模型”。
腾讯微信正式发布多模态大模型 POINTS 1.5
12 月 14 日消息,距离 POINT1.0 的发布已经过去两个月的时间,腾讯今天宣布推出 POINTS1.5。
告别“默片”:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频
11 月 8 日消息,智谱技术团队今天发布并开源最新版本的视频模型 CogVideoX v1.5,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的...