工业和信息化部出台《新型数据中心发展三年行动计划(2021-2023年)》,指出用3年时间,基本形成布局合理、技术先进、绿色低碳、算力规模与数字经济增长相适应的新型数据中心发展格局。近日,“东数西算”工程全面启动,8个算力枢纽节点、10个数据中心集群打造已经提上日程,开启了我国国土空间算力资源跨区域统筹布局的新篇章。

以算力“基建化”为契机 开启跨区域调配数据资源新篇章

算力已经成为数字经济时代新的生产力。无论是大数据在追踪疫情传播中的应用,还是建设智慧城市、智慧社会,抑或是线上办公、学习、娱乐,千行百业数字化转型对算力的需求与日俱增,以数据中心、智能计算中心为代表的算力基础设施,为保障社会生产生活高质量运转提供了重要支撑,持续促进线上线下加速融合,正在为数字经济发展注入强劲动能。

随着“东数西算”工程全面启动,打造全国算力一张网按下“快进键”,针对算力布局中的机遇和挑战、算力网络发展需要关注的问题等,《人民邮电》报记者分别采访了北京邮电大学电子工程学院张杰教授和百度副总裁谢广军。

一体化布局带动数据中心有序发展

记者:“东数西算”工程全面启动,开启了“新基建”领域跨区域资源调配新篇章,算力整体布局将如何发展?

张杰:从全国一体化大数据中心、算力网络等概念的酝酿提出,到“东数西算”这一国家算力枢纽建设工程的正式启动,横跨我国东西部、与能源资源空间分布相得益彰的算力新基建战略格局正全面铺陈开来。一方面围绕8个枢纽节点和10个数据中心集群,强化算力统筹智能调度能力建设,点面结合、以点带面,锚定国家算力布局“坐标图”。另一方面通过新建高速传输线路、整合升级现有网络等方式,打造高品质的算力连接,构建“东数西算”大数据走廊,完善算力协同运行“线路图”。

和以往企业根据自身业务需要进行数据中心建设的模式相比,以“东数西算”为契机发展一体化大数据中心协同创新体系,围绕算力基建化趋势下好下活全国“一盘棋”,涉及西部可再生能源开发利用、东西部之间数据有序流通、大数据和产业数字化带动经济效益提升等,都需要政府发挥重要的牵引作用。同时,国家枢纽节点的建设将有效汇聚数据生产要素,发挥算力辐射效应和增值作用,为区域数字经济发展注入强大动能。

谢广军:百度方面会持续加大对数据中心的投入,持续发展以大数据中心为代表的新基建,来应对AI时代与日俱增的算力需求。这些年,百度的数据中心布局和“东数西算”工程有很强的相关性。总体来看,不管是做自有业务,还是云计算相关业务,我们会按照业务类型和业务特点进行分类,比如说大致分成在线响应和离线的大数据处理,包括AI训练模型相关的数据处理。从业务特点出发,因地制宜提供算力服务,映射到数据中心布局来看,我们的在线业务基本在我国东部,为用户提供更低的访问时延、更好的访问体验;离线计算业务基本布局在我国西部,主要是出于运营成本方面的考虑,从部署数据中心成本、西部能耗价格等来看,能够显著节约企业运营成本。

记者:企业目前在算力布局方面取得了什么效果,计划在哪些方面取得突破?

谢广军:百度一直在分布式计算与存储、数据中心绿色转型方面寻求突破。围绕数据中心集群布局中心节点,同时推进边缘数据中心建设,以及结合边缘的网络覆盖优势积极布局5G MEC(移动边缘计算)等形成覆盖全国的分布式计算架构。在存储方面,硬件上我们自研了高密度、低成本的冰山冷存储体系。在软件上,我们通过存储分级,能够自适应管理数据的整个生命周期,比如热数据存放到SSD上,冷数据可以存到磁盘上,更冷的数据可以存到基本不耗电的磁盘阵列上。存储架构的革新带来数据中心成本的降低,在分布式存储架构和编码技术上的创新,使我们最低只需 1.1个副本,即可保证数据拥有同样的可靠性,而传统上通常需要3个副本。

在绿色算力方面,我们积极承担企业对于生态环境保护的社会责任。公司去年提出在2030年实现集团运营层面的碳中和目标,去年我们整个数据中心的可再生能源使用已经达到26万千瓦时,对于绿电使用方面,有量化数据指标来考核数据中心能耗使用。百度云计算(阳泉)中心是国内首个应用太阳能光伏直接并网技术的数据中心,从IT、电气、动力系统等方面采用多项绿色节能创新技术,在数据中心内首次应用污水回收再利用技术,大幅减少日污水排放量。

记者:从整体来看,全国一体化算力网络体系具有什么优势,能够带来哪些发展机遇?

张杰:首先,全国一体化算力网络体系的建立,畅通了产业数字化要素集聚的骨干脉络,夯实了支撑数字经济发展的坚强底座。数据资源作为一类生产要素,其规模分布和经济社会运行状况息息相关,算力则是推动数据资源深加工与价值塑造的关键。从国情分析来看,我国东部地区经济发展活跃,数据消费潜力巨大,而西部的数据需求量和活跃度都要低一些。如果把东部待加工的数据按需、有序引导到西部去,同时低成本、灵活匹配到算力资源丰富的枢纽节点上,将海量的数据资源变成信息消费品,进一步有效挖掘数字化潜在应用价值,具有十分重要的意义。

其次,算力网络国家枢纽节点全面展开建设,有助于解决当前制约数据要素敏捷快速流通的算力梗阻问题,实现以骨干带边缘,并通过建设高速网络、扩大算力规模等措施带动数据效率和效益提升,促进国家层面整体资源的有序流动,提升整个经济的活跃度,为数字经济发展提供强劲动力。

最后,“东数西算”工程的全面实施,要求各级政府做好算力网络的顶层设计,统筹算力建设的资源投入,推动算力服务有序开展,不断深化数据安全保障体系建设,加快实现数据需求热驻冷移,为相关行业和企业的未来算力布局提供方向性指引。

直面挑战差异化细分算力需求

记者:算力网络布局基础架构已经确定,目前面临哪些挑战?

张杰:梳理算力差异化需求对有序引导数据流向至关重要。现阶段算力规模重点包括基础算力、智能算力和超算算力三部分,分别适用于解决基础通用计算问题、人工智能计算问题和科学工程计算问题。在不同场景下计算任务的侧重点存在差别,例如后台加工、离线分析等对数据实时性要求不高,而科学工程计算往往需要提供很高的并行处理能力。对各类算力服务进一步细分,按照计算规模、实时性要求等进行梳理,通过算网协同合理规划数据流量流向,为计算任务和算力资源的有效匹配提供重要基础。“东数西算”工程对国家算力枢纽的定位不同,需要充分分析算力服务需求、效率的差异化特点,把适合“西算”的数据有序引导到西部算力枢纽,灵活按需匹配合适的算力节点。

谢广军:从业务架构角度来看,哪些需要放在东部处理,哪些需要放在西部处理,相关的访问层、数据库层,需要离线处理的部分首先需要从业务部署上拆分出来,才能为“东数西算”做好准备。在业务架构逐步清晰,能够实现业务层面的拆分之后,跨域调用算力资源需要的网络带宽、低时延高质量传输以及背后的成本都是需要考虑的问题。如何把握好运营成本和网络质量的平衡,使数据中心之间能够高效互联,包括数据中心和国家算力枢纽节点之间的相互配合,从而满足大量数据传输的大带宽、低时延要求,将是算网发展需要重点关注的问题。

记者:社会数据总量爆发式增长,对算力基础设施的要求不断提高,数据中心建设和运营管理方面有哪些考虑?

谢广军:围绕全国一体化算力网络架构,我们也在持续推进新一期的数据中心建设和大规模网络布局。按服务器的容量来说,一个地方应该是十几万台服务器的规模,当然我们会分期建设。在选址考察方面,我们的数据中心评估标准也在不断迭代、改进,在数据中心绿色转型方面,我们最近和中广核签署了战略合作框架协议,包含10亿千瓦时的绿电交易合同,主要用于河北保定地区的数据中心,使保定的自建数据中心能够提前实现碳中和目标。

对于区域性、本地化性质很强的业务,比如满足业务数据不出本地、对网络时延要求高的业务,我们通过区域性运营数据中心,持续深化云服务创新,包括自研昆仑芯片、提供PaaS(平台即服务)、SaaS(软件即服务)等业务,推进区域性产业赋能,为工业互联网、教育、医疗领域的数字化升级提供有力支撑。同时,我们也在积极探索对数据中心的统一管理模式,从集中式云计算向分布式云计算转变。

记者:从目前确定的8个算力枢纽节点、10个数据中心集群结构出发,规划层面哪些分析必不可少?

张杰:“东数西算”工程勾画了我国算力基础设施发展的未来轮廓,奠定了以国家算力枢纽为中心的全国一体化算力网络战略格局,迫切需要在数据中心集群建设运营云、网、智融合模式,在算力协同与数据低时延传输可靠保障等方面开展系统性规划与分析研究。由于该工程覆盖地域广、涉及领域多,建议推动全国性算力统筹和智能调度仿真运行平台建设,构建“东数西算工程大脑”,实现国家算力资源跨域调配一站式管理,从而助力破解“东数西算”工程建设规划、管理、优化、评估等难题。

实现海量数据计算分析、分流,数智相关服务决策优化,从而满足一体化算力调度要求,不仅需要建设大型算力节点,对节点间的高速互联网络开展建模仿真、性能分析等基础研究同样至关重要。例如算力节点增减、算网拓扑调整、计算能力变化等复杂情况,会对全网数据流通效率带来何种程度的影响,会对与算力资源调配关系密切的能源供需结构、数字经济活跃水平造成什么样的后果?从算力整体布局出发建立全网仿真平台与数字孪生系统,能够为算力节点之间流量通道的建设、避免单点故障影响算网效能,以及呈现、预测算网发展等提供重要抓手。

统筹发展数据中心 多维度赋能算力算效提升

远程办公协作、线上交流学习、云聚餐云聚会……这些新兴工作、生活方式,为新冠肺炎疫情发生后的工作交流、教育教学、亲朋欢聚提供了重要途径。随着数字化进程提速,大量业务从线下转到线上,带来的是数据规模激增、数据流动性大幅提升,而支撑这一切有序运转的“神秘力量”就是数据中心。

以合理布局有效平衡算力供需

数据中心布局事关我国东西部跨域统筹发展。数据显示,目前我国数据量年均增速超过30%,数据中心规模从2015年的124万家增长到2020年的500万家。数据中心顾名思义就是用来集中存储、计算、交换数据的地方,数据是贯穿新基建的生命线,数据中心具有承载数据、传输数据、计算处理数据的能力,是新基建有序运行的基础保障。

十三届全国人大五次会议批准的《关于2021年国民经济和社会发展计划执行情况与2022年国民经济和社会发展计划草案的报告》提出,加快构建全国一体化大数据中心体系,促进算力资源布局优化。

落子谋全局,数据中心建设也应统筹布局。传统上,我国通信网络主要依据人口聚集程度进行建设,网络节点普遍集中于京沪穗等一线城市。数据中心对网络依赖性强,随之集中于城市部署。为了解决东西部数据中心供需失衡、失序发展等问题,在数据中心建设发展过程中,应把握好应用需求大、能耗指标紧张之间的平衡,利用西部地区可再生能源丰富优势,突破跨省(区、市)数据传输的瓶颈,推动西部数据中心有效承接东部算力需求。同时,需要避免“数据中心孤岛”“云孤岛”等问题,通过加强数据中心、云、网络之间的协同联动,提高资源利用率。乘“东数西算”工程的政策“东风”,以全国一体化算力网络国家枢纽节点作为骨干连接点,统筹规划数据中心建设布局,引导大规模数据中心适度集聚,形成数据中心集群。

以先进技术加速提升算力规模

数据中心相关技术突破事关整体算力规模提升。数据中心是技术密集型新型基础设施,几乎将世界上最先进的信息技术都集成了起来,涉及网络、计算、存储、布线、制冷等十几个技术门类。简单来说,数据中心是一个超大号的机房,数字经济时代产生的海量数据在这里进行集中管理,包括存储、计算、交换。

相关机构的预测数据显示,2025年全球数据圈将增长到175ZB,而中国的数据圈将以年均30%的增速增长至48.6ZB,届时中国将成为全球最大的数据圈,数据圈规模将占全球数据圈的27.8%。面对巨量数据,首先要考虑的是数据存储问题。

从存储演化来看,存储先后经历了直连存储、集中存储与分布式存储三个大的阶段。数据中心的存储承载的是各行各业的数据,数据不能丢、访问不能停、访问不能等是数据中心存储的关键特征。

从数据中心产业链来看,先进技术突破是整体算力提升的重要抓手。各种服务器和网络设备芯片,如CPU、FPGA、AI加速芯片、GPU等,通过整合多核CPU、高密度互联I/O接口以及大容量高性能存储,以保证高算力、高稳定性以及尽量低的功耗要求等被同时满足,可以说底层关键技术的创新突破、网络设备的升级和调整,可以明显提高虚拟网络的传输效率,为整体算力规模提升提供源头活水,从而为数字经济高质量发展提供不竭动力。

以绿色转型持续优化用能结构

数据中心正积极迈向高效、清洁、集约、循环的绿色发展道路。谈到数据中心能耗,很多人称其为“电老虎”,数据中心的耗电量大概是什么水平呢?根据数据,一个超大型数据中心(以功率2.5千瓦为一个标准机架,机架规模1万个以上的数据中心)每年的耗电量为亿千瓦时级别。虽然如此,数据中心对经济的撬动作用却非常关键。以互联网行业数据中心为例,每消耗一千瓦时电可带动超过30元的行业收入,比钢铁行业高近两倍。

“唯耗电论”强行限制数据中心耗电量显然不可取,应该从带动经济发展的“效益最大化”角度来综合判断,一方面加快先进绿色技术产品应用,鼓励应用高效IT设备、制冷系统、供配电系统、辅助系统,引导新型数据中心向新能源发电侧发展,推动新型数据中心持续优化用能结构。另一方面,全面提高资源利用效率,深化新型数据中心绿色设计、施工、采购与运营管理,加快整合与改造高耗低效的数据中心。

PUE(电源使用效率)值已经成为国际上比较通行的数据中心电力使用效率衡量指标,PUE值越接近1,表示一个数据中心的绿色化程度越高。近年来,绿色发展成为数据中心的关键主题,我国数据中心的能效水平实现大幅提升,根据数据,2013年以前,全国超大型数据中心的平均PUE超过1.7,当前,全国超大型数据中心平均PUE为1.46。

船的力量在帆上,数据中心作为数据的中心、计算的中心、网络的中心,数据中心输出的算力已经逐渐成为驱动经济社会转型的重要力量。伴随数据存储、计算和应用需求大幅提升,数据中心正加速与网络、云计算融合发展,大步向新型数据中心演进。(吴双)

推荐内容