阿里云AI智算获评“算力中国”年度突破成果

日期：2023-08-21 20:09 来源：互联网

　　日前，由工业和信息化部、宁夏回族自治区人民政府共同举办的2023中国算力大会在银川举行。会上公布了算力领域最具影响力专家学者共同评选出的算力中国·年度突破成果，阿里云“PAI灵骏智算服务”作为国内AI智算基础设施代表获评此项重要荣誉。

　　该评选为攻坚算力领域中的热点、难点和关键问题设立，秉承“开创性、引领性、权威性、公平性”原则，旨在发掘在算力或相关产业达到全球领先水平的基础理论、创新方法、方法模式和平台应用的创新成果。评审委员会由中国科学院院士、中国工程院院士、知名高校及科研机构专家、领军企业技术带头人组成，集聚中国算力相关领域最具影响力的专家学者。

　　“PAI灵骏智算服务”是阿里云面向高速增长的AI计算需求打造的算力基础设施服务，可一站式为企业及开发者提供AI开发全流程的工程平台和智能算力。它具有超大并行计算规模、高性能、高效率、高利用率等特点，具备高达10万卡量级的集群可扩展规模，能支撑多个万亿参数大模型同时训练，其中单训练任务可达万卡规模，千卡规模的线性扩展效率达92%。

　　在此前实践锤炼中，PAI灵骏智算服务稳定支撑了10万亿参数多模态大模型的低能耗训练，在通义千问等大模型的训练和应用中，将大模型训练效率显著提高近10倍，推理效率提升2倍以上。

　　该评选认为，阿里云PAI灵骏智算服务“以高性能网络、高性能文件存储、高稳定性、极致软硬件联合优化能力和serverless化服务能力，为大模型研究、AI for Science、AIGC等场景提供坚实支撑”。

　　PAI灵骏智算服务在多个核心技术领域具备领先性和创新性。动辄上千亿参数的大模型训练，并非靠简单“堆显卡”就能完成，而是囊括底层算力、网络、存储、数据计算、AI框架等复杂技术的系统性工程。除了要通过精巧的设计实现超大计算工程落地外，还要做到“又快又省”，“榨干每一滴算力性能”。

　　在IaaS基础设施层，阿里云打造了智能计算集群灵骏，通过端网一体、软硬融合的可预期网络技术对集群计算资源进行统筹和优化，实现芯片间微秒级稳定互联和高效并行计算。相关技术创新大幅消除了AI算力拓展性瓶颈，灵骏集群规模最大可拓展至“10万卡级”，能为大模型的开发和应用提供灵活多尺度的智能算力，对上层平台应用提供便捷的容器化服务。

（责任编辑：AK007）

阿里云AI智算获评“算力中国”年度突破成果

相关推荐