高性能计算(HPC)十年演进(2015-2025)

2015-2025年,是高性能计算完成从科研院所专属的超算峰值竞赛载体,到AI大模型与科学计算双轮驱动的数字经济核心底座、从海外芯片与软件生态全链路垄断,到国产全栈自主可控全球领跑、从传统CPU多核并行计算,到异构融合、智算融合、绿色低碳的全新技术体系跨越式发展的黄金十年。

高性能计算(HPC,俗称“超算”),核心是通过并行计算、异构加速、高速互联等技术,构建具备千万亿次(P级)、亿亿次(E级)浮点运算能力的计算系统,是支撑基础科学研究、高端工程仿真、气象气候预报、生物医药研发的“国之重器”,更是AI大模型训练、自动驾驶仿真、工业数字孪生、具身智能训练的核心算力底座,其算力水平、自主化程度直接决定了国家的科技核心竞争力。

这十年,高性能计算的演进与中美科技竞争、AI大模型爆发、国产芯片突破深度绑定,与自动驾驶、机器人、具身智能的技术发展形成完整算力支撑闭环,完成了**「P级超算峰值竞赛启蒙期→异构计算与自主化突破成长期→E级超算与智算融合爆发期→全域智算与绿色低碳普及期」**四次核心范式跃迁;核心性能上,全球TOP1超算峰值算力从33.86PFlops提升至1.5EFlops以上,算力规模提升超40倍;能效比从2GFlops/W优化至70GFlops/W以上,提升35倍;技术路线从CPU单核串行演进为CPU+加速器异构融合、HPC+AI智算融合;产业格局从美国英特尔、英伟达全链路垄断,演变为国产超算实现从芯片、整机、操作系统到应用软件的全栈自主可控,全球TOP500超算上榜数量长期位居世界第一。

一、十年演进总纲与四大里程碑

高性能计算的十年演进,始终围绕自主化、异构化、绿色化、普惠化、智算融合五大核心主线推进,核心突破始终围绕“如何在更优的能效、更低的成本下,实现更高的算力规模、更强的自主可控能力、更广的行业覆盖”,整体可划分为四大里程碑阶段,与中国超算产业的十年崛起、全球算力格局重构完全对齐:

  1. 2015-2017 启蒙期:P级超算成为全球主流,峰值算力竞赛为核心主线,CPU多核并行为主流架构,超算应用集中于基础科学与高端工程领域,美国垄断核心芯片与软件生态,中国实现整机系统与国产芯片的从0到1突破,TOP500上榜数量首次超越美国。
  2. 2018-2020 成长期:中美科技竞争加剧,超算芯片出口管制升级,国产超算全栈自主化加速突破,CPU+GPU/加速器异构计算成为行业主流,E级超算原型机研发全面启动,AI算力需求开始崛起,HPC与AI融合进入萌芽阶段。
  3. 2021-2023 爆发期:全球正式进入E级超算时代,中美欧先后落地E级超算系统,AI大模型爆发推动智算中心成为HPC核心增长点,万卡/十万卡级AI超算集群成为常态,国产CPU、加速芯片、高速互联、软件栈实现全链路突破,智算融合成为行业核心技术路线。
  4. 2024-2025 普及期:E级超算实现规模化行业应用,Z级超算启动预研,量子-经典融合超算完成原型验证,全液冷绿色低碳技术成为行业标配,国产超算生态全面成熟,HPC从科研院所走向千行百业,形成“中心超算+边缘智算+端侧算力”的全域算力网络,中国在算力规模、自主化水平、应用落地规模上实现全球领跑。

二、四大阶段详细演进详解

第一阶段:2015-2017 启蒙期——P级超算峰值竞赛,国产整机突破

产业背景

2015年,全球高性能计算处于P级(千万亿次)超算的全面普及阶段,峰值算力竞赛是全球超算产业的核心主线,TOP500榜单成为各国超算实力的核心对标依据。此时的超算核心应用集中于气象预报、石油勘探、航空航天、基础物理、核模拟等国家战略级科研与工程领域,是典型的“国之重器”,仅国家级超算中心、头部科研院所、大型央企可负担建设与运营成本。

这一阶段,美国在超算领域形成全链路垄断,英特尔至强系列CPU占据全球超算90%以上市场份额,英伟达Tesla系列GPU开始进入加速计算市场,MPI并行计算框架、商业仿真软件完全被海外厂商掌控;中国超算实现了整机系统的跨越式突破,天河二号连续六次登顶TOP500榜单,但核心芯片仍依赖英特尔,面临严重的“卡脖子”风险。

核心技术演进
  1. 主流技术范式多核CPU并行计算为绝对主流,CPU+GPU异构计算开始起步,以双精度浮点运算能力为核心性能指标,采用胖树架构高速互联,核心设计目标是峰值算力突破,争夺TOP500榜单排名。
  2. 核心技术能力
    • 算力规模突破:全球超算正式进入千万亿次(P级)时代,2015年TOP1超算天河二号峰值算力达33.86PFlops,持续算力30.65PFlops;2016年神威·太湖之光峰值算力突破125.44PFlops,持续算力93.01PFlops,成为全球首个突破100PFlops的超算系统,连续四次登顶TOP500榜单。
    • 主流架构:以英特尔至强多核CPU为核心的SMP/MPP并行架构为主,占比超90%;少数超算采用CPU+GPU异构加速架构,用于分子动力学、气象模拟等并行度高的场景,异构加速的技术价值开始显现。
    • 高速互联与存储:采用InfiniBand FDR/EDR高速互联网络,延迟降至微秒级,带宽提升至100Gbps;并行存储系统带宽达TB级,可支撑数万核CPU的并行数据读写需求。
    • 能效比水平:主流超算能效比集中在1-2GFlops/W,TOP500榜单绿500榜首超算能效比不足7GFlops/W,功耗成为超算规模扩张的核心瓶颈,风冷为绝对主流散热方案。
  3. 国产技术突破:2016年国家超级计算无锡中心的神威·太湖之光,全面采用国产申威26010众核处理器,成为全球首个采用完全自主国产芯片登顶TOP500的超算系统,打破了海外芯片的垄断;国防科大、中科曙光、浪潮信息成为全球超算整机厂商第一梯队,2017年11月TOP500榜单中,中国上榜超算数量达202台,首次超越美国的143台,成为全球超算数量最多的国家。
工程化与落地能力
  • 全球超算建设集中于国家级超算中心,中国建成6个国家级超算中心,全球TOP500超算中,中国厂商制造的超算占比超40%,浪潮、中科曙光、联想位列全球超算整机厂商前三;
  • 应用场景高度集中于国家战略领域,气象气候、石油勘探、航空航天、核模拟、基础科学研究占比超90%,工业、金融、生物医药等民用场景渗透率不足10%;
  • 国产超算完成了千万亿次应用的突破,神威·太湖之光的“全球大气非静力云分辨模拟”“石墨烯纳米带电子结构计算”等应用,先后两次斩获戈登贝尔奖,实现了中国超算应用领域零的突破。
产业格局与核心痛点
  • 产业格局:美国形成全链路垄断,英特尔占据全球超算CPU市场90%以上份额,英伟达占据加速计算市场80%以上份额,ANSYS、ABAQUS等商业仿真软件完全垄断市场;中国在整机系统、国产芯片上实现突破,上榜数量全球第一,但核心芯片、基础软件、商业应用生态仍严重依赖海外。
  • 核心痛点:核心芯片、高速互联芯片、基础软件完全被海外垄断,“卡脖子”风险极高;超算应用高度集中于科研领域,民用场景渗透率极低,算力利用率不足30%;功耗与算力规模的矛盾凸显,风冷散热达到瓶颈,能效比提升缓慢;国产超算软件生态薄弱,商业应用软件适配不足。

第二阶段:2018-2020 成长期——自主化加速突破,异构计算全面普及

产业背景

2018年中美贸易战全面升级,美国将中国多家超算中心、整机厂商列入实体清单,禁止英特尔、英伟达向中国出口高端超算芯片,彻底倒逼中国超算产业走上全栈自主化的道路。同期,AI深度学习快速崛起,对算力的需求呈指数级增长,CPU+GPU异构计算的算力优势被彻底释放,成为超算产业的主流技术路线;全球主要国家正式启动E级(亿亿次)超算研发计划,超算产业从“峰值竞赛”转向“自主可控+应用落地”双主线发展。

这一阶段,国产超算芯片迎来爆发式突破,飞腾、鲲鹏、海光、龙芯等通用CPU,以及寒武纪、壁仞、海光DCU、华为昇腾等加速芯片先后完成流片与量产,打破了海外芯片的垄断;国产高速互联网络、并行存储、操作系统、编译软件实现全链路突破,E级超算原型机先后完成验收,中国超算产业从“整机跟随”走向“全栈自主”。

核心技术演进
  1. 主流技术范式CPU+GPU/加速器异构计算成为行业绝对主流,双精度科学计算与半精度AI计算并行发展,E级超算研发成为全球技术竞争焦点,自主可控成为核心设计目标,超算从“唯峰值论”转向“算力-能效-应用”综合发展。
  2. 核心技术突破
    • 异构计算架构全面成熟:CPU+GPU/众核加速器的异构架构占比从2017年的不足20%提升至2020年的80%以上,英伟达V100/A100 GPU成为超算加速计算的标配,异构架构可同时支撑传统科学计算与AI训练任务,算力利用率提升至60%以上。
    • E级超算关键技术突破:中美欧先后完成E级超算原型机研发,突破了百万核并行计算、高带宽低延迟高速互联、大规模并行存储、全系统液冷散热等核心技术,为E级超算正式落地奠定了基础;中国神威、天河、曙光三大E级超算原型机先后通过国家验收,核心技术全部自主可控。
    • 高速互联与散热技术升级:InfiniBand HDR 200Gbps高速互联网络成为主流,国产自主高速互联网络实现突破,延迟降至1μs以内;冷板式液冷技术开始规模化应用,可将超算PUE降至1.2以下,解决了大规模超算的散热与功耗瓶颈,能效比提升至10GFlops/W以上。
    • 国产芯片全链路突破:海光、鲲鹏、飞腾、龙芯等国产通用CPU实现规模化应用,性能达到英特尔同级别产品水平;海光DCU、华为昇腾910、寒武纪思元等国产加速芯片完成量产,可支撑科学计算与AI训练双场景,打破了英伟达的垄断;申威、飞腾国产芯片在国家级超算中心实现规模化部署。
  3. 国产技术状态:2020年11月TOP500榜单中,中国上榜超算数量达217台,连续5年位居全球第一,浪潮、中科曙光、联想稳居全球超算整机厂商前三;国产超算芯片实现从可用到好用的跨越,国家级超算中心国产芯片部署占比超50%;国产并行文件系统、操作系统、编译软件实现全链路自主,完成了E级超算全技术栈的验证。
工程化与落地能力
  • 全球超算建设从国家级中心向区域中心、行业中心延伸,中国建成8个国家级超算中心,数十个省级/行业超算中心,总算力规模突破1EFlops;
  • 应用场景开始向民用领域拓展,生物医药研发、工业仿真、金融风控、自动驾驶仿真、AI训练场景占比提升至30%以上,超算算力利用率提升至50%以上;
  • 国产超算应用实现规模化突破,先后有6项应用斩获戈登贝尔奖,覆盖大气模拟、地震模拟、材料计算、生物医药等多个领域,达到全球顶尖水平。
产业格局与核心痛点
  • 产业格局:美国仍占据高端芯片、软件生态的主导地位,英伟达占据全球加速计算市场85%以上份额;中国在整机制造、算力规模、国产芯片上实现全面突破,上榜数量全球第一,形成了从芯片、整机到应用的完整产业链,打破了海外厂商的全链路垄断。
  • 核心痛点:高端制程芯片仍受海外管制,7nm以下先进制程芯片流片受限;国产加速芯片的软件生态、算子库与英伟达CUDA生态仍有较大差距;商业仿真软件、工业应用仍被海外厂商垄断,国产软件适配不足;AI算力需求爆发,但传统超算对AI任务的适配性不足,智算与超算融合仍处于萌芽阶段。

第三阶段:2021-2023 爆发期——E级超算落地,智算融合全面爆发

产业背景

2021-2023年,全球超算产业正式进入E级时代,2022年美国Frontier超算成为全球首个真正落地的E级超算,峰值算力达1.686EFlops,随后美国El Capitan、欧洲LUMI、日本富岳升级、中国天河三号、神威E级超算先后落地,全球超算正式迈入亿亿次时代。同期,ChatGPT引发全球AI大模型爆发,对算力的需求呈指数级增长,AI大模型训练成为超算产业最大的增长引擎,智算中心建设全面爆发,万卡/十万卡级AI超算集群成为常态,HPC与AI深度融合成为行业核心技术路线。

这一阶段,国产超算芯片实现跨越式突破,华为昇腾910B、海光DCU、壁仞BR100等国产高端加速芯片实现规模化量产,性能达到英伟达A100/H100同级别水平;国产万卡集群实现大规模部署,彻底打破了英伟达GPU的垄断;国产E级超算实现全栈自主可控,在气象、材料、生物医药等领域实现规模化应用,中国超算产业从“跟跑”正式迈入“领跑”阶段。

核心技术演进
  1. 主流技术范式E级超算规模化落地,HPC+AI智算融合成为行业绝对主流,从传统双精度科学计算为主,转向“科学计算+AI训练”双轮驱动,万卡级异构集群成为标配,端到端全栈自主可控成为核心竞争力,绿色低碳成为超算建设的硬性指标。
  2. 核心技术革命
    • 全球正式进入E级超算时代:2022年美国Frontier超算成为首个持续算力突破1EFlops的E级超算,峰值算力达1.686EFlops;2023年美国El Capitan超算峰值算力突破2EFlops,成为全球最强超算;中国天河三号、神威E级、曙光E级超算先后落地,核心芯片、高速互联、软件栈全部自主可控,正式迈入E级时代。
    • 智算融合技术全面成熟:超算架构从传统科学计算优化,转向AI训练与科学计算双场景适配,FP16/BF16/INT8低精度算力成为核心指标,万卡/十万卡级AI超算集群实现规模化部署,可支撑万亿参数大模型的端到端训练;超算与AI深度融合,AI大模型用于加速科学计算仿真,超算算力用于大模型训练,形成双向赋能的技术闭环。
    • 国产高端芯片实现跨越式突破:华为昇腾910B、海光DCU二代、壁仞BR100、沐曦MX1等国产高端加速芯片实现量产,AI算力达到英伟达A100/H100同级别水平,完成了万卡集群的规模化部署,支撑了国内百亿/万亿参数大模型的训练;飞腾、鲲鹏、海光CPU在超算领域的市占率突破70%,实现了核心算力的自主可控。
    • 全液冷技术成为行业标配:浸没式液冷、冷板式液冷技术全面普及,新建超算/智算中心100%采用液冷方案,PUE降至1.1以下,顶尖液冷系统PUE可低至1.04,彻底解决了万卡集群的散热瓶颈;能效比大幅提升,绿500榜首超算能效比突破50GFlops/W,较2015年提升25倍。
    • 高速互联与存储技术升级:NVLink 4.0、InfiniBand NDR 400Gbps高速互联成为高端超算标配,国产自主高速互联网络实现400Gbps带宽突破,延迟降至500ns以内;分布式并行存储系统带宽突破10TB/s,可支撑十万卡集群的并行数据读写需求,解决了大模型训练的存储墙瓶颈。
  3. 国产技术全球领跑:2023年11月TOP500榜单中,中国上榜超算数量达179台,美国161台,中国连续8年位居全球第一;国产E级超算实现全栈自主可控,在气象预报、材料科学、生物医药等领域的应用达到全球顶尖水平;国产AI超算集群规模全球领先,建成数十个万卡级昇腾集群,总算力规模全球第二,彻底打破了海外芯片的垄断;中国超算应用累计8次斩获戈登贝尔奖,位列全球第二。
工程化与落地能力
  • 全球E级超算实现规模化落地,中美欧建成6套以上E级超算系统,总算力规模突破10EFlops;中国建成14个国家级超算中心,数十个行业智算中心,万卡级AI集群超50个,总算力规模位居全球第二;
  • 应用场景实现全面爆发,AI大模型训练、自动驾驶仿真、生物医药研发、工业数字孪生、气象气候、新能源研发等场景占比超60%,超算从科研院所走向千行百业,算力利用率提升至70%以上;
  • 国产超算实现商业化规模化落地,浪潮、中科曙光、华为占据国内超算/智算中心市场90%以上份额,国产超算解决方案出口至东南亚、中东、欧洲等全球20余个国家和地区。
产业格局
  • 全球格局形成中美双极引领:美国在高端制程芯片、CUDA软件生态上仍保持优势,但中国在算力规模、整机制造、国产芯片、应用落地规模上实现全面反超;中国TOP500上榜数量连续8年全球第一,超算整机厂商占据全球市场60%以上份额。
  • 国产全产业链全面成熟:形成了从芯片设计、晶圆制造、整机集成、高速互联、基础软件、行业应用的全链路自主可控产业链,国产CPU、加速芯片、操作系统、编译软件、行业应用软件实现全面突破,彻底摆脱了对海外技术的依赖。

第四阶段:2024-2025 普及期——全域算力网络建成,绿色普惠化发展

产业背景

2024-2025年,国内“东数西算”工程全面建成,全国一体化算力网络正式成型,E级超算实现规模化行业应用,Z级(泽它级,1000EFlops)超算启动预研;AI大模型从通用大模型向行业垂直大模型全面落地,对算力的需求从集中式训练转向“训练+推理”全场景,超算从中心式建设转向“中心超算+边缘智算+端侧算力”的全域算力网络;量子计算与经典超算的融合实现突破,量子-经典混合超算完成原型验证;国产超算生态全面成熟,从“可用”走向“好用”,成为全球超算产业的核心引领者。

同期,全球碳中和目标推动绿色超算全面普及,全液冷、余热回收、新能源供电成为超算建设的标配;国产超算方案随新能源汽车、AI大模型、工业解决方案出海,落地全球30余个国家和地区,国内厂商开始主导ISO/IEC超算技术标准的制定,从技术跟随者升级为全球规则的制定者。

核心技术演进
  1. 主流技术范式E级超算规模化应用,全域算力网络成型,量子-经典融合、智算深度融合成为核心方向,从集中式超算中心转向“云-边-端”全域协同算力体系,绿色低碳、全栈自主、普惠化成为行业核心发展目标。
  2. 核心技术全面成熟
    • E级超算实现全场景规模化应用:中国E级超算在气象气候、航空航天、生物医药、新能源、新材料等领域实现规模化商用,支撑了全球最高精度的100米分辨率全球气象预报、国产大飞机全机气动仿真、新冠疫苗与创新药研发等国家级重大项目,应用水平达到全球顶尖。
    • 全域算力网络全面建成:“东数西算”工程8大算力枢纽、10个数据中心集群全面建成,形成了“国家级E级超算中心+省级智算中心+行业边缘算力节点”的三级算力网络,实现了算力的全国统一调度、按需分配,算力利用率提升至85%以上,千行百业可通过云服务便捷获取超算算力。
    • 量子-经典融合超算实现突破:中国、美国先后建成量子-经典混合超算原型系统,将量子比特与经典E级超算深度融合,利用量子计算解决经典超算难以处理的量子化学、密码破解、材料模拟等问题,实现了算力的指数级提升,为Z级超算奠定了技术基础。
    • 国产超算生态全面成熟:国产CPU、加速芯片的编译器、算子库、开发框架全面完善,CUDA生态适配工具成熟,90%以上的主流科学计算、AI训练框架完成国产芯片适配;国产工业仿真、生物医药、气象模拟商业软件实现规模化应用,彻底打破了海外软件的垄断。
    • 绿色超算技术达到全球顶尖水平:浸没式液冷+余热回收技术全面普及,新建超算中心PUE普遍低于1.1,余热回收利用率超80%,可实现数据中心余热供暖、制冷,部分超算中心实现零碳运行;超算能效比突破70GFlops/W,较2015年提升35倍以上。
  3. 国产技术全球领跑:中国建成全球规模最大的一体化算力网络,总算力规模位居全球第一;国产E级超算的应用水平、自主化程度达到全球顶尖;国产加速芯片在AI训练场景的市占率国内超80%,全球市场份额突破30%;国内厂商深度参与ISO/IEC超算能效、高速互联、算力调度国际标准的制定,成为全球超算产业的核心引领者。
工程化与落地能力
  • 量产普及全面完成:2025年国内超算/智算中心总算力规模突破50EFlops,E级超算实现多领域规模化商用;工业企业、生物医药公司、AI初创企业超算云服务使用率超70%,超算从科研院所专属设施,变成了千行百业可便捷获取的普惠算力;
  • 全球化布局全面启动:国产超算解决方案出口至全球30余个国家和地区,浪潮、中科曙光、华为成为全球前三大超算整机厂商,市场份额超60%;国产智算集群、加速芯片随AI大模型方案出海,落地东南亚、中东、欧洲市场,成为全球AI算力基础设施的核心供应商。
产业格局
  • 全球格局中国全面领跑:中国成为全球最大的超算算力供给国、应用市场,国产超算整机全球市场份额超60%,国内市场占有率超90%;在E级超算、智算融合、绿色超算、量子-经典融合领域实现技术领跑,彻底改变了美国一家独大的全球超算格局。
  • 国产生态全面成熟:形成了以华为、中科曙光、浪潮、海光、飞腾为核心的全产业链厂商梯队,从芯片、整机、基础软件到行业应用实现了100%自主可控,彻底摆脱了对海外技术、产品的依赖。

三、高性能计算十年核心维度演进对比表

核心维度 2015年(启蒙期) 2020年(成长期) 2025年(普及期) 十年核心质变
全球TOP1超算峰值算力 33.86PFlops(天河二号) 415.5PFlops(富岳) 2EFlops以上(El Capitan/国产E级超算) 算力规模提升超60倍,从P级迈入E级时代
主流技术架构 多核CPU并行计算为主,异构计算起步 CPU+GPU/加速器异构计算全面普及 E级异构融合架构,HPC+AI智算深度融合,量子-经典混合架构 从单核串行到异构融合、智算融合的架构革命
核心芯片格局 英特尔CPU垄断90%市场,英伟达GPU起步 英伟达GPU垄断加速计算市场,国产芯片实现突破 国产CPU/加速芯片国内市占率超80%,全球份额突破30% 从海外全链路垄断,到国产全栈自主可控
核心应用场景 气象、石油、航空航天等基础科研领域,占比超90% 基础科研+工业仿真+AI训练,民用场景占比30% AI大模型、工业数字孪生、自动驾驶、生物医药等千行百业,民用场景占比超70% 从科研专属小众应用,到数字经济普惠算力底座
能效比水平 主流1-2GFlops/W,最高不足7GFlops/W 主流10GFlops/W,最高突破20GFlops/W 主流30GFlops/W,最高突破70GFlops/W 能效比提升35倍,绿色低碳技术全面成熟
散热方案 风冷为绝对主流,PUE>1.5 冷板式液冷规模化应用,PUE<1.2 全液冷技术成为标配,浸没式液冷普及,PUE<1.1,余热回收利用率超80% 从风冷高功耗,到全液冷零碳绿色超算
高速互联带宽 InfiniBand EDR 100Gbps InfiniBand HDR 200Gbps InfiniBand NDR 400Gbps,国产自主400Gbps网络 带宽提升4倍,延迟降至500ns以内
中国TOP500上榜数量 109台,全球第二 217台,全球第一 180台以上,连续9年全球第一 从跟跑到领跑,成为全球超算数量最多的国家
国产化水平 核心芯片100%进口,国产化率<10% 国产芯片规模化部署,国产化率>50% 全栈全链路自主可控,国产化率>90% 从完全依赖进口,到全球技术与产业领跑
算力普惠化水平 仅国家级超算中心可使用,企业使用率<10% 区域/行业超算中心建成,企业使用率>30% 全国一体化算力网络建成,云服务模式普及,企业使用率>70% 从科研专属,到千行百业普惠可用
核心价值 科技竞赛的峰值指标,国家战略科研工具 自主可控的国之重器,科研+产业双轮驱动 数字经济的核心算力底座,千行百业数字化转型的核心生产力 从峰值竞赛,到国家数字经济核心生产力

四、十年演进的五大核心本质转变

1. 定位本质:从科研专属的国之重器,到数字经济的通用算力底座

十年间,高性能计算完成了最核心的定位跃迁:从仅服务于国家战略级基础科研的“国之重器”,仅国家级超算中心可建设运营,成长为支撑AI大模型、工业数字化、生物医药、自动驾驶等千行百业的通用算力底座,通过云服务模式实现了算力的普惠化,从科研院所的专属设施,变成了数字经济时代的核心基础设施,彻底改变了其在国民经济中的定位与价值。

2. 技术本质:从CPU多核并行计算,到异构融合、智算融合的全新技术体系

十年间,高性能计算的技术底层完成了彻底重构:从英特尔至强CPU主导的多核串行/并行计算架构,演进为CPU+GPU/加速器的异构计算架构,最终升级为HPC+AI深度融合、量子-经典混合计算的全新技术体系;从以双精度浮点运算为唯一核心指标,转向双精度科学计算与低精度AI计算双轮驱动;从单纯追求峰值算力,转向算力、能效、应用、自主可控的综合发展,完成了从“计算硬件”到“智能算力体系”的本质跨越。

3. 产业格局本质:从美国全链路垄断,到国产全栈自主可控全球领跑

十年间,全球高性能计算的产业格局完成了从“美国一家独大”到“中美双极引领,中国全面领跑”的彻底逆转。2015年,美国垄断了核心芯片、基础软件、整机制造的全链路,中国超算核心芯片100%依赖进口;2025年,中国TOP500上榜数量连续9年全球第一,整机厂商占据全球60%以上市场份额,国产CPU、加速芯片实现全链路自主可控,国内市占率超80%,从技术跟随者成长为全球超算产业的技术创新者与标准制定者。

4. 应用本质:从基础科学小众应用,到千行百业全面普及

十年间,高性能计算的应用场景实现了指数级拓展:从气象预报、石油勘探、航空航天、核模拟等少数国家战略级科研场景,拓展到AI大模型训练、生物医药研发、工业数字孪生、自动驾驶仿真、金融风控、新能源研发、元宇宙渲染等千行百业;从只有少数科研人员可使用的专业设备,变成了中小企业可通过云服务便捷获取的普惠算力,应用场景占比从科研领域超90%,转向民用产业领域超70%,彻底打破了超算的应用边界。

5. 发展逻辑本质:从峰值算力竞赛,到自主可控与绿色普惠的高质量发展

十年间,高性能计算的发展逻辑完成了根本性转变:从以TOP500榜单排名为核心的峰值算力竞赛,转向以自主可控为核心、以应用落地为目标、以绿色低碳为底线的高质量发展。从单纯追求算力规模的扩张,转向算力利用率、能效比、产业链自主化、行业渗透率的全面提升,从“大而不强”的规模扩张,走向“全栈自主、普惠赋能”的高质量发展,成为支撑国家科技自立自强的核心基石。

五、现存核心挑战

  1. 高端制程芯片仍受海外管制,先进工艺存在瓶颈
    尽管国产超算芯片实现了全面突破,但7nm以下先进制程芯片的流片仍受海外出口管制限制,高端加速芯片的晶体管密度、频率与英伟达H100/H200仍有差距;高端高速互联芯片、存储芯片仍部分依赖进口,全产业链完全自主可控仍需持续深化。

  2. 软件生态与海外仍有差距,商业应用适配不足
    国产加速芯片的编译器、算子库、开发框架虽已全面完善,但与英伟达CUDA生态数十年的积累仍有差距,部分小众科学计算软件、高端工业仿真软件对国产芯片的适配仍不足;国产商业应用软件的市场份额仍较低,海外商业软件仍占据高端市场主导地位。

  3. 算力墙、存储墙、功耗墙的瓶颈仍未根本突破
    随着E级超算向Z级超算演进,冯·诺依曼架构的“存储墙”问题日益凸显,算力与数据读写速度的差距持续扩大;大规模超算的功耗持续攀升,尽管液冷技术大幅降低了PUE,但万卡/十万卡集群的总功耗仍达数十兆瓦,成为算力规模扩张的核心瓶颈;存算一体、近存计算技术仍未实现规模化落地。

  4. 算力调度与普惠化仍有不足,中小微企业渗透率低
    全国一体化算力网络虽已建成,但跨区域、跨平台的算力调度标准仍不统一,算力孤岛问题仍未完全解决;超算算力的使用门槛仍较高,中小微企业对超算的使用率仍不足,行业定制化解决方案不完善,算力普惠化仍需持续推进。

  5. 量子-经典融合超算仍处于原型阶段,工程化落地仍需突破
    量子计算与经典超算的融合虽已实现原型验证,但量子比特的保真度、相干时间仍有不足,量子算法的场景适配范围有限,大规模量子-经典混合超算的工程化落地、软件生态建设仍需5-10年的持续突破。

六、未来发展趋势(2025-2030)

1. Z级超算全面落地,全球进入泽它级算力时代

2030年前,全球将正式进入Z级(泽它级,1000EFlops)超算时代,中美欧将先后建成多套Z级超算系统,突破百万核/千万核并行计算、光电互联、存算一体、全系统液冷等核心技术,算力规模较E级超算提升1000倍,支撑全球气候变化模拟、可控核聚变、宇宙演化等终极科学问题的研究。

2. 量子-经典融合超算全面成熟,实现算力指数级提升

2030年前,百比特以上容错量子计算机将与经典Z级超算深度融合,形成标准化的量子-经典混合超算架构,解决经典超算难以处理的量子化学、材料设计、密码破解、优化算法等问题,实现算力的指数级提升,开启超算产业的全新时代。

3. 存算一体、光电计算架构重构超算底层技术

2030年前,存算一体芯片、近存计算、光电互联、光计算技术将实现规模化落地,彻底打破冯·诺依曼架构的存储墙瓶颈,超算能效比提升至1000GFlops/W以上,功耗降低90%以上,从根本上解决超算的功耗与算力扩张矛盾。

4. 全链路国产化体系全面成熟,主导全球行业标准制定

2030年前,高性能计算将实现从芯片设计、晶圆制造、整机集成、基础软件到行业应用的全链路100%国产化,国产超算全球市场份额突破70%;国内厂商将全面主导ISO/IEC超算技术、能效、算力调度国际标准的制定,成为全球超算产业的核心创新中心与规则制定者。

5. 算力网络全面普惠化,成为数字经济的水电煤

2030年前,全国一体化算力网络将实现“云-边-端”全场景覆盖,超算算力通过云服务模式实现按需分配、即取即用,千行百业超算使用率超90%,中小微企业渗透率超80%;超算将彻底从科研专属设施,变成数字经济时代像水电煤一样的普惠基础设施,支撑全社会的数字化转型与智能化升级。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐