← 返回

OpenAI发布GPT-5.4模型 推动AI自主代理技术发展

OpenAI正式推出新一代AI模型GPT-5.4,该模型在推理、编程及办公文档处理方面取得显着提升,并首次具备原生计算机操作能力,可直接控制电脑完成跨应用任务。GPT-5.4在网页浏览、工具调用和多源信息整合方面表现更优,错误率较GPT-5.2降低33%。其推理版本GPT-5.4 Thinking已集成至ChatGPT,支持任务过程可视化与用户实时调整。该模型现已通过ChatGPT、Codex及API向用户开放,Pro版本将面向企业及教育用户推出。

OpenAI发布GPT-5.4模型 推动AI自主代理技术发展

OpenAI于2026年3月5日推出GPT-5.4,这是该公司最新的AI模型,整合了在推理、编程以及处理电子表格、文档和演示文稿等专业工作方面的多项技术进步。该模型首次具备原生计算机使用能力,可代表用户操作电脑,跨多个应用程序执行任务。

GPT-5.4的发布标志着AI行业向“自主代理”(agentic)未来迈出重要一步,即由AI驱动的智能代理网络在后台完成复杂在线任务。OpenAI此前已推出ChatGPT Agent,与去年兴起的一系列类似工具共同推动该技术发展,如自动搜索并购买食材等。

该模型已通过API和AI编程工具Codex向开发者开放,同时推理版本GPT-5.4 Thinking正式集成至ChatGPT。OpenAI表示,GPT-5.4能够编写代码控制计算机,并根据屏幕截图发出键盘与鼠标指令。其在浏览器操作、工具及API调用的准确性和效率方面均有提升。

GPT-5.4在处理多源信息时表现更强,尤其擅长“大海捞针”类问题,可通过多轮搜索筛选最相关资料并整合为清晰、有逻辑的答案。OpenAI称其为“迄今为止最准确的模型”,个别陈述错误率较GPT-5.2降低33%。

在ChatGPT中,GPT-5.4 Thinking会为复杂查询提供工作大纲,并允许用户在响应过程中调整请求。OpenAI称这使用户“无需重头开始或多次交互即可引导模型获得精确结果”。该功能当前已支持网页端和Android应用,iOS版本即将推出。

GPT-5.4现已在ChatGPT、Codex和API中上线,GPT-5.4 Thinking面向Plus、Team和Pro用户开放。同时,性能更强的GPT-5.4 Pro版本已在API、ChatGPT Enterprise及Edu版本中推出,专为复杂任务设计。

编辑点评

GPT-5.4的推出标志着AI技术从被动响应向主动执行的重大转变,其原生计算机操作能力使AI具备‘代理’特征,真正实现跨应用自动化任务。这不仅提升个人工作效率,更可能重塑企业运营流程,尤其在数据分析、内容生成和客户服务等领域形成颠覆性影响。国际科技巨头如谷歌、微软、Anthropic等也在竞相布局自主代理系统,标志着AI竞争已进入‘系统级智能’新阶段。技术伦理与安全风险随之凸显,如AI自主决策的透明度、责任归属及潜在滥用,可能引发全球监管框架的重构。长远来看,此类技术或推动人机协作范式变革,重塑劳动力结构与知识生产方式。

相关消息:https://www.theverge.com/ai-artificial-intelligence/889926/openai-gpt-5-4-model-release-ai-agents
当日日报:查看 2026年03月06日 当日日报