Loading...

OpenAI 发布并开源医疗测试基准 HealthBench，旨在更好地衡量 AI 系统在医疗健康领域能力

AI前沿资讯8个月前发布 GOODNAV.NET

5.3K 0 0

GoodNav 报道，OpenAI 今日开源了面向医疗大模型的测试评估集 HealthBench，旨在评估 AI 系统在医疗领域的性能。

OpenAI 发布并开源医疗测试基准 HealthBench，旨在更好地衡量 AI 系统在医疗健康领域能力

HealthBench 由来自全球 60 多个国家/地区的 262 名医生撰写的 5000 段核心测试对话构成，其难度、真实性和覆盖范围都远超以往的测试集。它采用 262 名医生制定的 48562 个独特的评分标准，进行开放式评估，涵盖紧急情况、全球健康等多种医疗场景，评估更加全面。

# AI前沿资讯 # ChatGPT # OpenAI

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

ChatGPT 商业推荐被曝引用不可靠信息来源，专家提醒用户勿盲目信任

GoodNav.net

5K

OpenAI o1-preview AI 推理模型“不讲武德”：国际象棋对垒跳出规则外“作弊”取胜

GoodNav.net

6.1K

OpenAI 携手十余所顶尖大学启动 NextGenAI 联盟，豪掷 5000 万美元推动教育变革

GoodNav.net

3.9K

因使用 ChatGPT 生成虚假法律引文，美国一律师被罚款 1 万美元

GoodNav.net

2.1K

OpenAI 宣布 ChatGPT 自 4 月 30 日起停用 GPT-4 模型，全面升级至 4o 版本

GoodNav.net

4.1K

OpenAI 招聘主管点名批评 Meta：挖角手段让人闻到一股“绝望的味道”

GoodNav.net

3.7K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2025 goodnav.net All Rights Reserved