6月29日,由中国科学院计算机网络信息中心等单位联合研发的“异算方舟”国产计算系统软件生态全栈平台正式上线。这一平台聚焦国产算力长期面临的软件适配难、代码迁移难、科研操作繁琐等核心痛点,为科学计算软件生态建设提供了一体化解决方案。
硬件跑起来了,软件却没跟上
近年来,国产算力硬件突破的速度令人瞩目。就在上周,中国“灵晟”超级计算机以2.19EFlops的持续计算性能登顶全球TOP500榜首,成为世界首个持续性能突破2EFlops的超算系统。6月15日,算苗科技旗下3D TokenPU芯片A4E正式流片,采用自研RISC-V架构和国产工艺,专攻大模型推理场景。江原科技、兆芯、海光信息等企业也在6月底密集发布芯片新品与全栈方案。
硬件高歌猛进,软件生态却成为明显短板。大量代码难以适配国产设备,底层算法运行效率低,工程仿真操作复杂——许多优质科研成果空有算力芯片却跑不起来。有行业分析指出,国产算力在推理端虽已“相对可用”,但训练端集群能力、生态适配与综合成本仍存短板,正从“有没有”迈向“好不好用”的关键阶段。软硬协同失衡、自主底座不牢,是当前最紧迫的挑战。
“异算方舟”试图回答一个关键问题:国产算力硬件跑起来了,软件怎么跟上?
平台构建了三层核心能力。底层搭载“九衍枢算法库”,汇集16款高性能计算工具,全面适配国产算力架构,核心运算性能可实现十倍以上提速。中层部署代码转换大模型BoundX,能够自动适配多种国产算力环境,替代繁琐的人工改写工作,大幅降低技术迁移门槛。据披露,BoundX融合了知识图谱与跨环境验证技术,可辅助开发者将CUDA代码高效迁移至国产GPU软件生态。
三层能力叠加,实现了算法、代码、应用的全链条打通。这意味着国产算力正从单一的硬件领先,走向软硬件协同成熟的新阶段。
打破CUDA护城河,国产算力生态走向闭环
“异算方舟”的行业意义不止于技术突破。长期以来,NVIDIA的CUDA生态构筑了极高的迁移壁垒——企业从CUDA切到国产芯片,不是买一张卡插上去就行,要改代码、调算子、验证精度、重新做性能优化。这个迁移成本让大量企业和科研机构望而却步。“异算方舟”的BoundX大模型,正是瞄准这一“护城河”发力。
与此同时,政策端也在加速推进。2026年政府工作报告明确将超大规模智算集群、算电协同纳入新基建工程,全国算力基建投资预期达4500亿元。七部门近日联合印发文件,强调算力竞争的核心已转向“芯片、软件生态与系统级集群的综合效率优化”。在海外高端芯片受限的背景下,国产AI芯片厂商正加速适配放量,全栈生态迎来增量机遇。
“异算方舟”的上线,恰逢其时。当然,一个平台的发布只是开始。国产算力软件生态的完善,需要芯片厂商、操作系统、算法框架、应用开发者的持续协同。有观点认为,国产算力正从“有没有”迈向“好不好用”的关键阶段。“异算方舟”提供的是一套基础设施,而生态的繁荣,最终取决于有多少开发者愿意用它、有多少应用能真正跑起来。
但方向已经明确:国产算力不能只有硬件的“躯体”,更要有软件的“灵魂”。“异算方舟”迈出了关键一步——让算力真正为科研和产业所用,而不仅仅是实验室里的参数。