Loading...

英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

GoodNav 报道,科技媒体 marktechpost 5 月 6 日宣布,英伟达发布了开源自动语音识别(ASR)模型 Parakeet TDT 0.6B。该模型已在 Hugging Face 平台上开源。

Parakeet TDT 0.6B 的突出特点是速度和转录质量。该模型处理 60 分钟音频仅需 1 秒,速度是现有主流开源 ASR 模型的 50 倍。

在 Hugging Face 的开源 ASR 排行榜上,Parakeet TDT 0.6B 的字错率(WER)低至 6.05%,位居开源模型之首。这一卓越性能为实时转录、语音分析、呼叫中心智能以及音频内容索引等企业级应用提供了有力支持。

英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...