← 返回

谷歌发布两款新型AI芯片应对“智能代理时代”

谷歌宣布推出两款专为“智能代理时代”设计的新型张量处理单元(TPU),分别专注于模型训练和推理任务,以提升效率并降低运营成本。这两款芯片将于今年晚些时候上市。谷歌高级副总裁兼AI与基础设施首席技术官阿明·瓦赫达特表示,此举旨在满足AI代理快速发展的需求。训练芯片性能较第七代Ironwood TPU提升2.8倍,同价位下推理芯片性能提升80%。新推理芯片TPU 8i采用384兆字节SRAM,是Ironwood的三倍,旨在支持数百万AI代理同时运行。谷歌未与英伟达芯片直接比较性能,但此举被视为其在AI硬件领域挑战英伟达的最新举措。

谷歌发布两款新型AI芯片应对“智能代理时代”

谷歌于2026年4月22日宣布推出两款新型张量处理单元(TPU),分别专注于人工智能模型的训练和推理任务,以应对日益增长的AI代理(AI agents)需求。这两款芯片计划于2026年下半年正式上市。

谷歌高级副总裁兼AI与基础设施首席技术官阿明·瓦赫达特在博客中表示:“随着AI代理的兴起,我们判断社区将从专用于训练和推理的独立芯片中受益。” 新推出的训练芯片在同等价格下,性能较第七代Ironwood TPU提升2.8倍;而推理芯片性能提升80%。

新推理芯片名为TPU 8i,采用384兆字节静态随机存取存储器(SRAM),是Ironwood TPU的三倍。谷歌CEO桑达尔·皮查伊在博客中指出,该架构旨在“以经济高效的方式,实现大规模吞吐量和低延迟,支持数百万AI代理并发运行”。

尽管谷歌未直接与英伟达芯片进行性能对比,但此举被视为其在AI硬件领域挑战市场领导者英伟达的最新努力。英伟达方面则透露,其即将推出的Groq 3 LPU硬件也将大量采用SRAM,与AI芯片初创公司Cerebras的技术路径相似,后者于本月早些时候提交了IPO申请。

编辑点评

谷歌此次发布专用训练与推理芯片,标志着AI硬件架构从通用化向专业化加速演进,反映出AI代理规模化部署对算力架构的深层需求。当前,AI代理正从实验性应用转向企业级和消费级服务,对低延迟、高并发的推理能力提出更高要求。谷歌通过提升SRAM容量与架构设计,直接回应了这一趋势,其TPU 8i的384MB SRAM设计显着增强了数据局部性,可降低内存访问延迟,提升多代理并行效率。此举虽未直接挑战英伟达在GPU市场的主导地位,但表明科技巨头正通过差异化硬件策略构建生态护城河。长期来看,若谷歌芯片在云服务和企业客户中获得广泛采用,或推动全球AI基础设施向更细分、更专业化的硬件体系转型,对全球AI供应链与算力成本结构产生结构性影响。同时,SRAM的大量应用也暗示未来AI芯片将面临制造工艺与功耗的进一步挑战。

相关消息:https://tech.slashdot.org/story/26/04/22/1746252/google-unveils-two-new-ai-chips-for-the-agentic-era?utm_source=rss1.0mainlinkanon&utm_medium=feed
当日日报:查看 2026年04月23日 当日日报