OpenAI发布GPT-5.4模型 推动AI自主代理技术发展
OpenAI于2026年3月5日推出GPT-5.4,这是该公司最新的AI模型,整合了在推理、编程以及处理电子表格、文档和演示文稿等专业工作方面的多项技术进步。该模型首次具备原生计算机使用能力,可代表用户操作电脑,跨多个应用程序执行任务。
GPT-5.4的发布标志着AI行业向“自主代理”(agentic)未来迈出重要一步,即由AI驱动的智能代理网络在后台完成复杂在线任务。OpenAI此前已推出ChatGPT Agent,与去年兴起的一系列类似工具共同推动该技术发展,如自动搜索并购买食材等。
该模型已通过API和AI编程工具Codex向开发者开放,同时推理版本GPT-5.4 Thinking正式集成至ChatGPT。OpenAI表示,GPT-5.4能够编写代码控制计算机,并根据屏幕截图发出键盘与鼠标指令。其在浏览器操作、工具及API调用的准确性和效率方面均有提升。
GPT-5.4在处理多源信息时表现更强,尤其擅长“大海捞针”类问题,可通过多轮搜索筛选最相关资料并整合为清晰、有逻辑的答案。OpenAI称其为“迄今为止最准确的模型”,个别陈述错误率较GPT-5.2降低33%。
在ChatGPT中,GPT-5.4 Thinking会为复杂查询提供工作大纲,并允许用户在响应过程中调整请求。OpenAI称这使用户“无需重头开始或多次交互即可引导模型获得精确结果”。该功能当前已支持网页端和Android应用,iOS版本即将推出。
GPT-5.4现已在ChatGPT、Codex和API中上线,GPT-5.4 Thinking面向Plus、Team和Pro用户开放。同时,性能更强的GPT-5.4 Pro版本已在API、ChatGPT Enterprise及Edu版本中推出,专为复杂任务设计。
编辑点评
GPT-5.4的推出标志着AI技术从被动响应向主动执行的重大转变,其原生计算机操作能力使AI具备‘代理’特征,真正实现跨应用自动化任务。这不仅提升个人工作效率,更可能重塑企业运营流程,尤其在数据分析、内容生成和客户服务等领域形成颠覆性影响。国际科技巨头如谷歌、微软、Anthropic等也在竞相布局自主代理系统,标志着AI竞争已进入‘系统级智能’新阶段。技术伦理与安全风险随之凸显,如AI自主决策的透明度、责任归属及潜在滥用,可能引发全球监管框架的重构。长远来看,此类技术或推动人机协作范式变革,重塑劳动力结构与知识生产方式。