稿件搜索

实探哈尔滨智算中心:AI芯片国产化率已达100%

  本报记者 李乔宇

  哈尔滨冬日的室外温度动辄低至零下二十摄氏度,中国移动智算中心(哈尔滨)(以下简称“哈尔滨智算中心”)的展厅却温暖如春。

  与其他地区的数据中心相比,哈尔滨智算中心具有独特的温度优势。“数据中心是公认的‘耗能大户’,但在哈尔滨,我们每年有157天不用空调降温,将大幅减少智算中心降温所需要的能耗。”在上述展厅里,中国移动通信集团(以下简称“中国移动”)黑龙江有限公司政企事业部经理郅刚告诉《证券日报》记者:“同时我们也对智算中心的热能有精细化的二次利用,展厅的温度以及整个园区的供暖都来自机房的免费的‘热’。”

  独特的气候优势,让全球运营商最大单集群智算中心落户于此。如今,哈尔滨智算中心已经实现AI芯片100%国产化,首次通过国产网络设备探索1.8万张智算卡单集群部署规模上限,可提供6.93EFLOPS(每秒693亿亿次半精度浮点运算)智能算力,相当于300多万台高性能计算机的算力水平。

  筑起“极致算力”

  据介绍,哈尔滨智算中心的前身哈尔滨数据中心作为“四云合一”的数据中心,具备强大的数据处理和存储功能,承载了中国移动用户十亿量级的行程码数据;作为全国5G网络东北大区的核心节点,这里还承担着北京和河北地区的通信备份任务,在诸如冬奥会等重大活动期间,哈尔滨能够提供与北京同等级别的通信保障;哈尔滨数据中心还汇聚了包括百度在线网络技术(北京)有限公司、阿里巴巴集团控股有限公司、腾讯控股有限公司在内的120余家互联网大厂的服务器。

  “同时我们还具备强大的算力输送能力。”郅刚表示,中国移动在哈尔滨建设了全国400G的OTN(光传送网)省际骨干网,能够实现地市之间1毫秒、省内5毫秒、全国20毫秒的信息传输速度,为算力“大脑”构建起高速运转的“神经”。

  在哈尔滨智算中心内部,一条写着“大干两个百天 奋力书写智算领域自立自强的时代答卷”的红色横幅特别醒目。

  在两个“一百天”里,中国移动完成了哈尔滨数据中心迈向哈尔滨智算中心的转型升级,完成3千多平方米高功耗机房重大调整改造,千万级精密器件复杂施工;30多个单位、千余人的协同作战,实现了提前4个月建成全球运营商最大单集群智算中心。

  谈及哈尔滨智算中心,郅刚用了“极致算力、极限组网、极效存储、极速运维”几个词。“极致算力”指的是6.93EFLOPS智能算力;“极限组网”指的是采用国产46KW风冷网络设备、构建最大规模两级组网;“极效存储”指的是采用大规模融合分级存储,满足大模型训练时海量、多样数据的高效处理和高吞吐要求;“极速运维”指的是通过制度、技术和标准三大措施,实现分钟级故障定界定位和小时级模型断点续训,保障万张AI加速卡长时间稳定并行训练,为万亿模型训练提供高性能、高可用、高可靠的算力底座。

  “目前,中国移动九天千亿参数模型已在集群上实现高效、长期稳定训练。”郅刚表示。

  国产化程度提升

  哈尔滨智算中心中红色横幅提到的“智算领域的自立自强”,既体现在万卡集群赋能国内AI产业发展上,也体现在AI芯片国产化率100%上。

  “万卡集群”是由超过一万张加速卡(如GPU、TPU、NPU等专用AI芯片)组成的高性能计算系统,主要用于加速人工智能模型的训练和推理。

  “我们每台机柜会安装三台全国产化算力服务器——昇腾智算服务器Atlas 800T A2,每台服务器搭载4颗CPU芯片和8颗NPU芯片,每一颗NPU芯片提供376TFLOPS(每秒一万亿次浮点运算)算力,八颗NPU芯片一共能够提供3PFLOPS(每秒一千万亿次浮点运算)算力,哈尔滨智算中心的服务器总数为2304台,整体能够保障6930PFLOPS高效稳定的算力输出。”

  值得一提的是,《证券日报》记者注意到,随着技术、性能和生态建设上持续完善,我国AI芯片已经能够实现与国际顶尖产品同台竞技。

  2024年4月份,中国移动智算中心(呼和浩特)为彼时全球运营商最大单体智算中心,AI芯片国产化率超85%,智能算力规模高达6.7EFLOPS。四个月后,哈尔滨智算中心正式上线投产,AI芯片国产化率以及智能算力规模较中国移动智算中心(呼和浩特)均有增长。此外,政府为主导的城市智能计算中心多采用国产AI芯片。

  谈及万卡集群智算中心国产化态势,中昊芯英(杭州)科技有限公司首席解决方案架构师平晓峰表示,目前国内国产GPU芯片厂商与NPU、TPU等芯片厂商都在积极布局万卡集群市场。

  据平晓峰介绍,GPU芯片与NPU、TPU芯片各有千秋,均能充分满足万卡集群智算中心的算力需求。“GPU出现较早,最初用于图像处理,因其高并行计算能力而在大模型出现的早期阶段成了支撑模型计算的硬件选择,但其功耗和成本较高。”平晓峰表示,“像以TPU为代表的AI芯片,则是专门针对AI大模型计算框架而设计,在AI智算场景中所表现出来的计算性能、算力利用率、能效比等更有优势。”

  “万卡集群智算中心的国产化趋势已经较为明显。”平晓峰表示,智能算力建设迈入万卡时代,算力需求旺盛,市场前景广阔,预计国产AI芯片的蓬勃发展与万卡集群智算中心的算力需求将实现相互成就。

证券日报APP

扫一扫,即可下载

官方微信

扫一扫 加关注

官方微博

扫一扫 加关注

喜欢文章

0

给文章打分

本文得分 :0
参与人数 :0

0/500

版权所有证券日报网

京公网安备 11010202007567号京ICP备17054264号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800网站传真:010-83251801电子邮件:xmtzx@zqrb.net