OpenAI发布GPT-5.4模型推动AI自主代理技术发展

2026-03-06 02:03

OpenAI正式推出新一代AI模型GPT-5.4，该模型在推理、编程及办公文档处理方面取得显着提升，并首次具备原生计算机操作能力，可直接控制电脑完成跨应用任务。GPT-5.4在网页浏览、工具调用和多源信息整合方面表现更优，错误率较GPT-5.2降低33%。其推理版本GPT-5.4 Thinking已集成至ChatGPT，支持任务过程可视化与用户实时调整。该模型现已通过ChatGPT、Codex及API向用户开放，Pro版本将面向企业及教育用户推出。

OpenAI发布GPT-5.4模型推动AI自主代理技术发展

OpenAI于2026年3月5日推出GPT-5.4，这是该公司最新的AI模型，整合了在推理、编程以及处理电子表格、文档和演示文稿等专业工作方面的多项技术进步。该模型首次具备原生计算机使用能力，可代表用户操作电脑，跨多个应用程序执行任务。

GPT-5.4的发布标志着AI行业向“自主代理”（agentic）未来迈出重要一步，即由AI驱动的智能代理网络在后台完成复杂在线任务。OpenAI此前已推出ChatGPT Agent，与去年兴起的一系列类似工具共同推动该技术发展，如自动搜索并购买食材等。

该模型已通过API和AI编程工具Codex向开发者开放，同时推理版本GPT-5.4 Thinking正式集成至ChatGPT。OpenAI表示，GPT-5.4能够编写代码控制计算机，并根据屏幕截图发出键盘与鼠标指令。其在浏览器操作、工具及API调用的准确性和效率方面均有提升。

GPT-5.4在处理多源信息时表现更强，尤其擅长“大海捞针”类问题，可通过多轮搜索筛选最相关资料并整合为清晰、有逻辑的答案。OpenAI称其为“迄今为止最准确的模型”，个别陈述错误率较GPT-5.2降低33%。

在ChatGPT中，GPT-5.4 Thinking会为复杂查询提供工作大纲，并允许用户在响应过程中调整请求。OpenAI称这使用户“无需重头开始或多次交互即可引导模型获得精确结果”。该功能当前已支持网页端和Android应用，iOS版本即将推出。

GPT-5.4现已在ChatGPT、Codex和API中上线，GPT-5.4 Thinking面向Plus、Team和Pro用户开放。同时，性能更强的GPT-5.4 Pro版本已在API、ChatGPT Enterprise及Edu版本中推出，专为复杂任务设计。

编辑点评

编

编辑点评

2026-03-06 02:03

GPT-5.4的推出标志着AI技术从被动响应向主动执行的重大转变，其原生计算机操作能力使AI具备‘代理’特征，真正实现跨应用自动化任务。这不仅提升个人工作效率，更可能重塑企业运营流程，尤其在数据分析、内容生成和客户服务等领域形成颠覆性影响。国际科技巨头如谷歌、微软、Anthropic等也在竞相布局自主代理系统，标志着AI竞争已进入‘系统级智能’新阶段。技术伦理与安全风险随之凸显，如AI自主决策的透明度、责任归属及潜在滥用，可能引发全球监管框架的重构。长远来看，此类技术或推动人机协作范式变革，重塑劳动力结构与知识生产方式。

OpenAI发布GPT-5.4模型 推动AI自主代理技术发展

编辑点评

相关阅读

AI初创公司Cursor洽谈20亿美元融资 资产估值超500亿美元

诺贝尔奖得主物理学家警告：人类未来50年生存概率极低

尽管伊朗局势紧张，股市仍保持上涨态势

欧盟推出儿童网络年龄验证应用 引发安全争议

北京亦庄半程马拉松：人形机器人首次超越人类创纪录

OpenAI发布GPT-5.4模型推动AI自主代理技术发展

AI初创公司Cursor洽谈20亿美元融资资产估值超500亿美元

欧盟推出儿童网络年龄验证应用引发安全争议