[返回风云天下首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

传华为昇腾910C测试顺利,9月发布对标英伟达H200

送交者: chentom60[☆★★声望品衔11★★☆] 于 2024-06-10 23:18 已读 1213 次 1赞  

chentom60的个人频道

+关注
2024-06-11 07:11·晋小乐

业界消息,在华为昇腾910B被业内大规模采购使用之后,又即将推出升级版的昇腾910C处理器,预计将在9月的发布会上正式亮相,采用7纳米工艺,性能对标业界领先的NVIDIA H200。


产能准备:充足应对市场需求


在半导体制程方面,尽管面临国际市场的不确定性,华为通过与合作伙伴的紧密协作,确保了昇腾910C的产能充足。预计华为在2024年出货40万颗910B和数万颗910C。预计2025年910C出货量将在30万颗左右。910C的单卡价格,可能会在20万人民币左右,相较于NVIDIA的H200,具有一定价格优势。


昇腾910C:性能与技术的双重飞跃


昇腾910C的推出,是华为在AI加速卡领域的又一次技术飞跃。根据最新的测试结果,910C在性能上有望实现重大突破,特别是在INT8算力上,预计将接近英伟达H200。

软件生态:CUDA的优势与华为的追赶


NVIDIA的CUDA平台为矩阵运算和AI运算提供了丰富的方法和优化工具链,这是其长期积累的软件生态优势。华为虽然在人力和时间上存在差距,但通过不断优化常用算子性能,正在逐步构建自己的软件生态。


高速互联:追赶NVIDIA的步伐


在高速互联技术方面,华为的HCCS虽然与NVIDIA的NVLINK存在差距,但通过技术创新和材料堆叠,正在逐步缩小这一差距。昇腾910C预计将采用先进的2.5D集成技术和高速缓存,进一步提升机器内互联的性能。


竞争分析:NVIDIA的H200只是半代升级


在2023年11月13日的全球超算大会(SC23)上,英伟达发布了新一代AI芯片HGX H200,用于AI大模型的训练,相比于其前一代产品H100,H200的性能提升了约60%到90%。


H200是英伟达H100的升级版。与过往GPU升级主要都在架构提升上不同,H200与H100都基于Hopper架构。在同架构之下,H200的浮点运算速率基本上和H100相同。而其主要升级点转向了内存容量和带宽。具体包括141GB的HBM3e内存,比上一代提升80%,显存带宽从H100的3.35TB/s增加到了4.8TB/s,提升40%。


H200核心GPU运算数据与H100完全一致,然而,在大模型推理表现上,其提升却极其明显。H200在700亿参数的Llama2大模型上的推理速度比H100快了一倍,而且在推理能耗上H200相比H100直接降低了一半。


对于显存密集型HPC(高性能计算)应用,H200更高的显存带宽能够确保高效地访问数据,与CPU相比,获得结果的时间最多可提升110倍。


因为框架未有改变,H200与H100有着完全的兼容性。这意味着已经使用先前模型进行训练的AI公司将无须更改其服务器系统或软件即可使用新版本。

喜欢chentom60朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]