英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%
GoodNav 报道,科技媒体 marktechpost 5 月 6 日宣布,英伟达发布了开源自动语音识别(ASR)模型 Parakeet TDT 0.6B。该模型已在 Hugging Face 平台上开源。
Parakeet TDT 0.6B 的突出特点是速度和转录质量。该模型处理 60 分钟音频仅需 1 秒,速度是现有主流开源 ASR 模型的 50 倍。
在 Hugging Face 的开源 ASR 排行榜上,Parakeet TDT 0.6B 的字错率(WER)低至 6.05%,位居开源模型之首。这一卓越性能为实时转录、语音分析、呼叫中心智能以及音频内容索引等企业级应用提供了有力支持。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...