发布时间:2025-12-4
类别:行业动态
阅读:65
摘要:
中国 AI 芯片在推理赛道寻突破
【中国经营报 记者 李丹 2025年11月25日】当大模型预训练的“算力竞赛”渐入稳态,AI推理场景的爆发正重塑全球芯片产业格局。在近日举办的2025中国AI芯片产业峰会上,一组数据引发行业热议:国内主流AI芯片仍以12纳米与7纳米工艺为主,而北美头部企业已实现2纳米制程量产,这直接导致国产单芯片算力仅为北美同类产品的30%。但差距之下,中国企业正依托推理赛道的场景优势,通过算力组网、存算一体等创新路径实现系统级反超。业内普遍认为,随着智能体AI成为算力增长核心,强调场景适配性的国产AI芯片正从“可用”向“好用”加速升级,推理赛道将成为国产芯片突围的关键战场。
制程工艺的代际差,是当前国产AI芯片面临的核心瓶颈。峰会现场发布的《2025中国AI芯片产业白皮书》显示,英伟达最新推出的2纳米制程H200芯片,单芯片FP16精度算力达1.8PFlops,而国内主流的华为昇腾950DT、壁仞BR100等7纳米芯片,单芯片同精度算力普遍在500-600TFLOPS之间,仅为前者的30%左右。“制程差距直接体现在晶体管密度与能效比上,2纳米芯片的晶体管密度是7纳米的3.5倍,每瓦性能提升超2倍。”清华大学微电子研究所教授王健安解释道。
工艺受限的背后,是设备与生态的多重制约。国内企业虽已实现7纳米芯片量产,但依赖的是成熟制程光刻机,无法支撑2纳米等先进制程研发;而北美企业凭借EUV光刻机优势,在先进制程上形成技术垄断。更严峻的是,先进制程的研发成本呈指数级增长,从7纳米到2纳米的研发投入需增加4倍以上,这对国产企业构成巨大资金压力。
但AI产业的发展逻辑正在发生转变。英特尔中国研究院院长宋继强指出,未来80%的AI计算将集中在推理领域,而推理场景的核心需求并非极致的单芯片算力,而是高吞吐量、低延迟与高性价比的平衡。这一特性恰好为国产芯片提供了差异化竞争空间。“训练芯片要‘通吃’所有模型,推理芯片却可以针对安防、金融等特定场景定制优化,这正是我们的优势所在。”华为昇腾芯片产品线总裁张迪煊表示。
面对单芯片的性能差距,国内企业正通过“集群组网”策略实现系统级算力的弯道超车。这种将数十甚至数百颗国产芯片通过高速互联技术组成算力集群的方案,能在成熟制程基础上突破性能上限。百度与长城、飞腾联合推出的国产AI平台,正是这一思路的典型实践——该平台基于长城ZQ2200服务器,搭载飞腾FT2000+/64 CPU与百度昆仑AI芯片,通过Kubernetes实现多卡协同管理,单集群AI算力达640万亿次,能效比达到360Gflops/W,已应用于智慧城市、智能电力等领域。
高速互联技术的突破为算力组网提供了关键支撑。华为研发的昇腾智联芯片,实现了芯片间100Gbps的高速互联,集群延迟控制在5微秒以内;壁仞科技则通过自研的Chiplet互联技术,将多颗BR100芯片封装为“算力模组”,使集群算力线性提升。“由100颗BR100组成的算力集群,整体算力可达50PFlops,超过由20颗H200组成的集群,而建设成本仅为后者的60%。”壁仞科技市场总监李哲介绍道。
这种系统级方案已获得行业认可。阿里云近期宣布,其智能客服系统已完成国产AI芯片集群的替换,采用云天励飞思元670芯片组建的推理集群,在日均处理10亿次语音交互的场景下,响应延迟从120ms降至80ms,硬件成本降低35%。“对于推理场景而言,客户更关注‘单位算力成本’而非单芯片性能,这正是组网方案的核心优势。”阿里云智能芯片负责人陈松政表示。
推理赛道的爆发,正由智能体AI强势驱动。宋继强透露,2025年智能体AI的Token使用量已实现140倍增长,达到每月1400万亿Token,其算力需求将从今年起逐步超越训练场景。与传统Chatbot不同,智能体AI需将任务拆解为多个步骤,调用多种模型协同完成,完成一个基于思维链的回答使用的Token数,是传统方法的10倍,复杂度更是达到100倍。
这种复杂性恰好放大了国产芯片的场景适配优势。针对智能座舱场景,地平线征程6P芯片专门优化了多模态数据处理能力,能同时接入摄像头、激光雷达等8路传感器数据,在识别车辆、行人等目标时,准确率较通用芯片提升12%;在金融风控场景,中科寒武纪思元370芯片通过定制化的加密计算单元,实现了交易数据的实时推理与隐私保护,已在招商银行等机构规模化应用。
存算一体技术的突破,则进一步强化了国产芯片的能效优势。香港大学与西安电子科技大学的联合团队,利用忆阻器打造自适应ADC架构,攻克了存算一体芯片的“能耗黑洞”,使芯片功耗锐减57.2%,面积缩小30.7%。基于该技术的边缘推理芯片,已在智能摄像头领域实现量产,其在夜间人流统计场景下,续航时间从7天延长至15天,成本降低20%。“智能体AI在边缘端的部署需求激增,低功耗、小尺寸的国产芯片正迎来爆发期。”该团队负责人洪海桥表示。
尽管在推理场景取得突破,但国产AI芯片仍面临生态短板。目前全球主流AI框架对国产芯片的适配率仅为65%,部分复杂模型的部署需进行二次开发,增加了企业使用成本。为解决这一问题,国内企业正通过“EDA+IP”协同模式加速生态构建。概伦电子与壁仞科技联合开发的芯粒设计平台,将EDA仿真工具与高速互联IP深度融合,使芯片与框架的适配周期从3个月缩短至1个月。
政策与资本的加持则为产业升级提供了保障。“十五五”规划明确将AI芯片列为集成电路攻关重点领域,广东省近期出台的专项政策提出,对推理芯片的场景化应用项目给予最高2000万元补贴。2025年前三季度,国内AI芯片领域融资额达186亿元,其中80%流向推理芯片企业。
行业专家认为,国产AI芯片的突围无需在先进制程上“死磕”。“推理赛道的竞争核心是‘场景定义芯片’,而非‘芯片定义场景’。”中国电子信息产业发展研究院院长张立指出,随着智能体AI推动推理算力需求持续爆发,国产芯片只要坚持场景适配、系统优化、生态共建的路径,就能在全球产业格局中占据重要席位。从“可用”到“好用”的升级,正是中国AI芯片的破局之道。
Copyright 2024 gkzhan.com Al Rights Reserved 京ICP备06008810号-21 京