打造算力“高速公路”,新以太释放新算力
2021年5月31日,武汉人工智能计算中心竣工,成为科技部已批复的15个国家人工智能创新发展试验区中率先投入运营的项目。武汉人工智能计算中心的建设是对《国务院关于印发新一代人工智能发展规划的通知》的贯彻执行,顺应湖北省政府提出的“使湖北成为中部战略性新兴产业发展核心区、国家战略性新兴产业发展高地”的发展目标。武汉人工智能计算中心可提供高达100P的超大算力,为武汉经济发展注入强劲动力。
栽下算力梧桐树,引来产业金凤凰
曾经,某城市由于没有算力中心,科学家只能把装满一卡车的硬盘拉到附近有算力中心的城市,排队等待计算结果,严重影响企业的创新速度和效率。
算力中心类似于科技创新磁场,通过供给丰富算力,吸引着众多科研机构和创新企业。武汉人工智能计算中心提供的普惠算力,已开始对本地产业集群实施算力赋能。例如,武汉人工智能计算中心与当地药企合作,药物配方可先在计算机上做筛选、模拟,再择优进行临床实验,大大缩短了新药的上市时间。目前,多家高校院所和企业与武汉人工智能计算中心的项目合作已经快速展开。在武汉人工智能计算中心加持下,武汉在数字经济时代也正跑出加速度,迸发强大活力。
业界独家全以太方案,构建超强算力底座
传统的高性能计算网络(HPC:high-performance computing)通常使用专网Fiber Channel(FC)和InfiniBand(IB)技术,FC和IB技术封闭,长期被国外部分厂商把持,面临较高的安全风险。
算力安全已是政府和企事业单位刻不容缓的基本需求。对企业而言,算力是重要的商业资源和生产要素,算力安全治理能力已成为企业的重要竞争力。武汉人工智能计算中心使用华为超融合数据中心网络 CloudFabric 3.0解决方案,把算力安全、创新主动权、发展主动权牢牢掌握在自己手中,彻底消除安全隐患。
华为CloudFabric 3.0解决方案业界独家使用全无损以太架构,即三张网统一为0丢包以太网架构,实现流量承载融合,打破异构协议限制。该方案使用iLossless智能无损算法和CloudEngine数据中心交换机,突破国外技术壁垒。iLossless算法代替专家经验实现实时精准控速,保证网络0丢包;CloudEngine数据中心交换机参与在网计算,实现规模不变,算力翻番。
1-3-5智能运维,全生命周期自动管理
人工智能中心组网复杂,设备之间交互流量大、计算量大。一旦出现网络故障,会严重影响上百设备的计算效率。武汉人工智能计算中心使用华为iMaster NCE智能管控系统,提供可视化智能运维,实时检测网络健康。
华为将数字孪生方法论引入网络管理领域,实现建全生命周期的自动化。基于网络数字建模,可综合评估400+影响网络设计的因子,可推荐最优网络设计方案并实现配置变更的秒级校验。基于网络知识图谱,可以实现故障1分钟感知、3分钟定位和5分钟修复。通过大数据挖掘与建模,识别网络对象与对象间的关联关系与故障扩散规律,感知90%潜在风险。
无损网络技术,助力大算力低能耗
作为传统用电大户,数据中心需要向更绿色化、低能耗、可持续的方向转变。而网络作为联接计算存储资源的大动脉,对于提升算力降低能耗具有重要意义。
一方面,降低网络能耗可带动整体能耗的改善。另一方面,提升网络能力可显著降低单位算力能耗。
根据开放数据中心委员会(ODCC) 2019年测试数据,在同等服务器规模下,网络实现无损可大幅提升算力水平,任务完成时间可降低30%,即单位算力能耗下降30%。华为超融合数据中心网络CloudFabric 3.0解决方案提供无损网络技术,可大幅提升算力能效比。
预计到2023年,武汉人工智能计算中心将带动武汉市人工智能核心产业规模达500亿元,带动相关产业规模超过5000亿元。算力的关键在于数据流通与处理效率,华为超融合数据中心网络CloudFabric 3.0解决方案将助力打通算力中心计算、存储和网络三大资源的大动脉,打造数据流转的高速公路,为武汉数字经济和企业数字化转型构筑坚实的算力底座。