湖南大学计算机学院院长,国家超算长沙中心总工程师唐卓代表著作《算力原生》,即将由机械工业出版社出版。
在人工智能浪潮席卷全球的今天,算力已成为驱动数字经济发展的新引擎。然而,我们正面临一个严峻悖论:一方面,AI大模型的参数规模从数亿飙升至数万亿,训练成本动辄数百万美元,算力需求呈指数级增长;另一方面,GPU、NPU、FPGA等专用芯片百花齐放,算力形态日益多元异构,却常常陷入“算力孤岛”与“资源错配”的困境。
传统应用适配算力的模式,正遭遇系统性瓶颈——开发者被迫为不同硬件编写多套代码,技术栈碎片化严重;静态资源分配导致专用算力闲置、通用资源过载;厚重的硬件抽象层更锁死了应用创新空间。我们迫切需要一场从“适配”到“原生”的范式革命。
算力原生是一种面向智能时代的全新计算范式。它的核心思想是:从算力本身的特性出发,重新设计应用架构、开发范式与调度策略,让应用从诞生之初就原生地契合底层硬件,实现算力效能的最大化释放。
其本质是推动算力产业从资源供给向能力服务的关键演进。算力不仅仅是冰冷的硬件指标,还应是可被精准描述、按需调用与动态组合的服务能力——最终实现“让算力如水电般自由流动、随需取用”的宏伟愿景。
算力原生代表了三个根本性的理念革新:
从“拥有资源”到“达成能力”:开发者不再申请“8核CPU、16G内存”这样的静态资源,而是描述“执行约十亿次浮点运算”或“处理1GB视频流”的能力需求。系统智能调度,将推理交给NPU,视频转码交给GPU,实现能力供给。
从“软件定义”到“软硬协同”:打破传统模式硬件通用化、上层软件化对硬件效率的牺牲,推动软件架构与硬件芯片共同演进。软件架构的设计深刻影响硬件芯片的迭代,新硬件的特性也在软件开发之初就被充分利用。
从“静态配给”到“动态感知”:算力原生要求系统具备全面感知能力,系统实时感知应用需求与硬件状态,进行毫秒级精细调度。任务可从繁忙GPU实时迁移至空闲CPU,资源始终与需求动态匹配,保持最优运行状态。
算力原生的实现,依托于自下而上、协同运作的三层技术体系:

图1算力原生三层架构图
基石层:算子原生化
聚焦计算最底层效率与统一性,为上层屏蔽硬件复杂性。
资源统一建模:构建异构算力的统一语义“身份证”,让系统能无视硬件差异,一致地理解、比较和组合资源。
无服务器架构:将应用拆解为细粒度函数,调度器可像搭积木一样,将每个函数精准匹配到性能、成本最优的硬件单元,实现极致弹性。
算子融合创新:将多个细粒度操作合并为单一复合内核,中间数据在高速缓存中直接传递,大幅减少内存读写,释放硬件峰值性能。例如为Transformer注意力机制设计专用融合算子,可创造数量级性能提升。
负责将复杂业务逻辑智能编排为高效工作流,实现全局资源动态优化。
跨域资源传输:针对东数西算等分布式环境,将任务调度与数据调度联合优化。系统智能决定“计算去哪儿”和“数据存哪儿”,通过迭代求解最大化计算与传输重叠,降低跨域延迟。
多工作流容器调度:针对容器镜像拉取慢的问题,算力原生建立精细的优化模型,利用镜像分层共享机制,结合混合智能算法,解决边缘节点存储与网络瓶颈,提升并发任务处理效率。
弹性伸缩迁移:赋予任务动态调整规模与位置的能力。系统实时监控,在负载不均、成本更优时自动迁移任务,并通过检查点/恢复技术最大限度减少服务中断,实现“负载均衡”与“成本最优”的统一。
实现从资源管理到智能服务的跨越,降低AI应用门槛。
超智融合计算:采用从全局到本地分层协同的时空熵调度机制,智能实现跨集群负载均衡,解决大模型训练中的资源错配。创新“时空熵”调度,确保复杂工作流可靠执行。
工作流自动生成:结合大语言模型与检索增强生成技术,构建从“意图描述”到“代码生成”的自动化流水线,从专业模板库检索并增强上下文,让大语言模型生成结构正确、语义专业的工作流代码,并自动化评估质量。
训推一体服务:打破训练与推理的壁垒,构建数据采集到在线反馈的闭环。通过参数高效微调降低更新成本,利用推理反馈数据自动迭代模型,让AI应用持续进化。
算力原生不仅是一次技术优化,更是一场深刻的架构革命。它直指当前计算产业的核心痛点:
开发困境:终结多硬件多代码的碎片化开发,让开发者专注业务逻辑。
资源浪费:告别“大马拉小车”与“小马拉大车”的错配,追求极致资源效能。
创新瓶颈:释放新型硬件的独特优势,打通从底层创新到上层应用的价值通道。
在AI、大数据、物联网深度融合的未来,算力需求将持续爆发。算力原生通过全局优化和智能调度,为千行百业的数字化转型提供强大动力,是支撑数字经济发展的关键基础设施理念。
从理念到全面落地,算力原生仍面临异构硬件互操作、资源精准隔离与保障、开发生态构建等挑战。但方向已然明晰:优先在AI计算、科学仿真等迫切场景突破,再逐步向通用场景扩展。
随着技术突破与生态成熟,算力原生终将实现其愿景——让算力像水、电一样,成为易于使用、按需分配、高效可靠的基础能力,为构建智能世界奠定坚实基石。