谷歌发布两款新型AI芯片应对“智能代理时代”
谷歌于2026年4月22日宣布推出两款新型张量处理单元(TPU),分别专注于人工智能模型的训练和推理任务,以应对日益增长的AI代理(AI agents)需求。这两款芯片计划于2026年下半年正式上市。
谷歌高级副总裁兼AI与基础设施首席技术官阿明·瓦赫达特在博客中表示:“随着AI代理的兴起,我们判断社区将从专用于训练和推理的独立芯片中受益。” 新推出的训练芯片在同等价格下,性能较第七代Ironwood TPU提升2.8倍;而推理芯片性能提升80%。
新推理芯片名为TPU 8i,采用384兆字节静态随机存取存储器(SRAM),是Ironwood TPU的三倍。谷歌CEO桑达尔·皮查伊在博客中指出,该架构旨在“以经济高效的方式,实现大规模吞吐量和低延迟,支持数百万AI代理并发运行”。
尽管谷歌未直接与英伟达芯片进行性能对比,但此举被视为其在AI硬件领域挑战市场领导者英伟达的最新努力。英伟达方面则透露,其即将推出的Groq 3 LPU硬件也将大量采用SRAM,与AI芯片初创公司Cerebras的技术路径相似,后者于本月早些时候提交了IPO申请。
编辑点评
谷歌此次发布专用训练与推理芯片,标志着AI硬件架构从通用化向专业化加速演进,反映出AI代理规模化部署对算力架构的深层需求。当前,AI代理正从实验性应用转向企业级和消费级服务,对低延迟、高并发的推理能力提出更高要求。谷歌通过提升SRAM容量与架构设计,直接回应了这一趋势,其TPU 8i的384MB SRAM设计显着增强了数据局部性,可降低内存访问延迟,提升多代理并行效率。此举虽未直接挑战英伟达在GPU市场的主导地位,但表明科技巨头正通过差异化硬件策略构建生态护城河。长期来看,若谷歌芯片在云服务和企业客户中获得广泛采用,或推动全球AI基础设施向更细分、更专业化的硬件体系转型,对全球AI供应链与算力成本结构产生结构性影响。同时,SRAM的大量应用也暗示未来AI芯片将面临制造工艺与功耗的进一步挑战。