随着美国芯片出口管制政策的不断收紧,许多中国科技企业面临高性能AI芯片断供的困境,产品研发和升级受到严重制约。黄仁勋明确表示希望继续与中国客户合作,并正通过开发特供芯片等方式,在符合监管要求的前提下全力维持对中国市场的技术支持。
为符合美国出口管制政策,英伟达对其芯片进行了多方面的技术调整:
计算精度控制:通过降低FP16、FP8等高性能计算精度,确保算力指标低于管制阈值。
互联带宽限制:对NVLink高速互联技术进行带宽限制,如H20芯片的NVLink带宽降至900GB/s。
存储方案调整:采用GDDR7显存替代HBM系列高端存储,在保证基本性能的同时降低成本。
这些调整使得特供芯片在垂类模型推理场景中表现良好,虽然无法进行万亿参数大模型训练,但仍能满足大多数企业的实际需求。
英伟达为中国市场开发特供芯片已经形成了相对成熟的流程:
1.市场需求调研:与阿里巴巴、腾讯、字节跳动等主要客户深入沟通,了解具体性能需求和应用场景。
2.架构设计阶段:基于现有架构(如Hopper、Blackwell)进行性能调整,确保符合美国法规要求。
3.样品测试验证:向核心客户提供样品进行测试,收集反馈并优化设计。
4.大规模量产:通过供应链合作伙伴进行批量生产,通常从样品到量产需要3-6个月周期。
据供应链消息,基于Blackwell架构的B30特供芯片预计2025年底前向中国客户提供样品。
从实际应用情况看,英伟达特供芯片在特定场景下仍具有明显优势:
腾讯太极团队在16卡H20-96G集群上实现了DeepSeek模型15800+ tokens/s的处理速度,达到业内**水平。
字节跳动采用H20集群支持抖音短视频AI审核,单卡日均处理视频内容超50万小时,效率提升30%。
阿里巴巴基于H20构建的智能推荐系统,在淘宝平台实现了商品推荐延迟降低40%的显著改善。
虽然特供芯片的**算力不如**版,但通过软件优化和系统级调优,仍然能够满足大多数商业应用的需求。
英伟达在开发特供芯片过程中面临多重挑战:
国产芯片的竞争:华为昇腾910B在推理效率上已接近H20,价格低20%,在政务、金融领域市占率突破35%。
政策不确定性:美国出口管制政策可能进一步收紧,导致特供芯片开发需要不断调整。
客户顾虑:特供芯片的许可证有效期限制和供应不确定性,使部分客户转向国产解决方案。
黄仁勋坦言,如果英伟达不在这里,华为等中国本土企业完全能够找到自己的解决方案。
英伟达的特供芯片策略是一把双刃剑。一方面,它确实为中国企业提供了过渡期的算力支持,缓解了AI发展的燃眉之急;另一方面,这种"阉割版"方案也可能刺激中国自主芯片产业的发展,加速国产替代进程。
我认为,英伟达的真正优势不在于单一芯片性能,而在于CUDA生态和全栈解决方案。即使特供芯片性能有限,但其完整的软件生态系统仍然是许多中国企业难以替代的选择。
**数据:有行业分析师预测,2025年中国AI服务器市场中,国产芯片占比将达40%,与英伟达(42%)几乎平分秋色,这一比例较2024年的18%大幅提升。
本站为注册用户提供信息存储空间服务,非“爱美糖”编辑上传提供的文章/文字均是注册用户自主发布上传,不代表本站观点,版权归原作者所有,如有侵权、虚假信息、错误信息或任何问题,请及时联系我们,我们将在第一时间删除或更正。