国产芯片在部署超大规模 MoE 模型方面取得了显著进展,推理性能创下新高,不仅摆脱了对英伟达的依赖,更实现了对英伟达 Hopper 架构的全面超越。
华为昇腾是实现这一突破的关键,其解决方案包含两个产品:
CloudMatrix 384 超节点:部署 DeepSeek V3 / R1 模型,在 50ms 时延约束下,单卡解码吞吐量达到惊人的1920 Tokens/s。