2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。面对人工智能从“基础模型构建”迈向“规模化应用落地”的重要转折点,公司宣布将核心研发资源集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。
一、产业变局:推理竞速,从“参数内卷”转向“效能为王”
过去一年,全球算力产业的风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在 2025 年 4 月发布第七代 TPU “Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化。
与此同时,围绕“更低时延、更低成本”的推理芯片与系统能力,产业整合动作也在加速。2025 年 12 月,英伟达与 Groq 达成非独占许可安排,并吸纳其核心工程人才团队加入,此举被视为强化推理与实时工作负载能力的关键布局。
这些行业信号共同指向一个趋势:推理侧竞争已不再单纯是“把模型做得更强”的参数竞赛,而是“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率已成为规模化落地的最大门槛。
二、架构破局:GPNPU 路线重新定义“通用生态”与“极致能效”
推理时代的胜负手不在单点指标,而在系统级协同:既要承接主流软件生态,又要在推理负载下实现更优能效与更低时延。
云天励飞确立了 GPNPU 技术路线,并提出了“GPNPU = GPGPU + NPU + 3D 堆叠存储”的核心公式,旨在兼顾通用计算的“通用性”与 NPU 的“高效性”,在工程层面同时解决可迁移、可部署、可持续降本三大难题。
在通用生态层面,鉴于 CUDA 仍是全球最成熟、覆盖最广的加速计算平台之一,云天励飞的 GPNPU 架构致力于正视主流生态的迁移成本问题,能够实现一行代码完成CUDA 程序兼容,极大降低了进入生产系统的门槛。
在推理能效层面,NPU 能够实现更高的计算效率和能效比,面对大模型推理这种高度结构化、可被体系化优化的负载,专用化设计带来的能效优势更容易转化为真实成本优势,这也是国际厂商持续加码专用路线的重要原因。
同时,针对行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 堆叠存储及更前沿的互连技术,以提升带宽与能效,降低推理时延。
在架构工程与产品化路径上,云天励飞进一步强调了两项可落地的优势。首先是“算力积木”架构,即通过 Chiplet 扩展与互连思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态。
其次是面向推理的系统级优化能力,公司拒绝单纯的“芯片参数竞赛”,而是主张把“模型怎么跑得更省”沉淀到架构里,围绕真实业务负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的综合最优解。
三、五大核心要素构筑坚实护城河,将打造千卡集群
云天励飞董事长兼 CEO 陈宁在演讲中指出,支撑公司跨越周期的,是长期积累构筑的商业护城河。他将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,不仅是云天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。
针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO 兼董秘邓浩然特别强调,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了极高的确定性。
陈宁还详细解读了云天励飞的“1+4”架构:“1”指聚焦于AI大算力推理芯片,“4”则是四大事业部。作为生态构建者,四大事业部旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业部作为基石,将凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设。此外,云天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。
四、蓝图展开:DeepVerse 领衔,全场景算力矩阵精准卡位
面向未来三年的规划,云天励飞CTO李爱军表示,将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。
路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。
推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI 才能从“看得见的能力”走向“用得起的生产力”。未来,云天励飞将以 GPNPU 架构为核心,大力推进云端大算力强化软硬协同与存储体系攻坚,力争将百万 Tokens 推理成本降低100 倍以上,推动大模型从示范应用走向规模化交付。
深圳市人工智能学会(Shenzhen Association for Artificial Intelligence,英文简称SAAI),是由深圳市人工智能科学与技术领域科技工作者和相关企事业单位自愿组成,依照国家有关法律法规登记的深圳市地方性、非营利性学术社团组织。中国科学院深圳先进技术研究院是SAAI理事长单位,北京大学深圳研究生院、清华大学深圳国际研究生院、哈尔滨工业大学(深圳)、南方科技大学、香港中文大学(深圳)、深圳理工大学、深圳大学、深圳技术大学、深圳职业技术大学、华为技术有限公司、深圳市腾讯计算机系统有限公司、中兴通讯股份有限公司等21个高等院校、科研机构和高新技术企业为SAAI理事会员单位。SAAI积极推动专业委员会和工作委员会建设,现已成立十一个专业委员会:1) 机器人智能系统专业委员会(SAAI TC-RIS);2) 自然语言理解专业委员会(SAAI TC-NLU);3) 智能金融专业委员会(SAAI TC-IF);4) 认知系统与智能信息处理专业委员会(SAAI TC-CSIIP);5) 法律人工智能专业委员会(SAAI TC-LAI);6) 智慧空间专业委员会(SAAI TC-SmartSpace);7) AI伦理治理专业委员会(SAAI TC-AIEG);8)AI红树林专业委员会(SAAI TC-AIM);9) 智慧海洋专业委员会(SAAI TC-SmartOcean);10) 大模型技术及应用专业委员会(SAAI TC-LM);11)脑机智能专业委员会(SAAI TC-BCI);以及五个工作委员会:1) 女性AI科技工作者委员会(SAAI WC-WAIP);2) 青年工作委员会(SAAI WC-Young);3) AI城市治理工作委员会(SAAI WC-AIUG);4) 财经人工智能工作委员会(SAAI WC-FEAI);5) 教育工作委员会(SAAI WC-AIEC)。
SAAI作为一家非营利性科技服务平台,汇聚产、学、研、政、投多方力量和资源,学会秉持服务国家“科教兴国”战略愿景,以“持续推进人工智能前沿基础理论和与关键技术研究”、“促进人工智能赋能新兴产业发展”和“推广人工智能科普教育”为三大核心使命,确立了“学术高地、引领知识、赋能产业”三大核心价值。SAAI全力打造了一系列专业品牌活动,包括:“深圳人工智能奖”、“信息科技女性精英论坛 (Women’s Elite Forum of Information Technology, 简称WeFIT)”、“人工智能科普基地”、“深圳市优秀科技学术论文遴选”、“SAAI -产学研政投沙龙”、“SAAI -博士论坛”、“SAAI -高质量科技探索营”、“SAAI -青年研享论坛”、和“SAAI -新兴产业智库”等。依托丰富的专业资源与人才优势,SAAI积极开展国内外学术交流、科学普及、专业培训、学术出版、人才推荐、学术评价、成果鉴定、评优评奖、专家咨询、建言献策以及科技会展等工作;加速推动深圳市和广东省人工智能科研成果产业转化,助力我国新兴产业升级与新质生产力提升,吸引世界各地的人工智能人才、技术与资源,向深圳及广东聚集,提升深圳市在全国以及全球人工智能领域的技术标准制定权和产业降本增效影响力。
| SAAI的三服务 | SAAI的三支持 |
| 服务支撑国家战略 服务助力创新知识和创新技术 服务粤港澳大湾区人工智能技术及应用的可持续发展 | 支持产学研政投的发展需求 支持会员个人的发展需求 支持会员单位的发展需求 |
欢迎大家咨询深圳市人工智能学会秘书处的微信号:

电话 (Phone): +86 (755) 2690 2448
网站 (Website): saai.net.cn
邮箱 (Email): saai2019@163.com
地址 (Address): 深圳市留仙大道3370号南山智园崇文园区T1(1号楼)4层405房
关注微信公众号