← 返回

苹果研究团队开发新型本地AI代理Ferret-UI Lite

苹果研究团队发布Ferret-UI Lite,该模型仅含30亿参数却在基准测试中超越24倍参数规模的竞品。该代理专注于跨平台图形用户界面交互,通过实时裁剪、合成训练数据和强化学习技术实现性能突破。

苹果研究团队开发新型本地AI代理Ferret-UI Lite

苹果研究团队日前发布了一款名为Ferret-UI Lite的轻量级AI代理模型,该模型仅包含30亿参数,却在基准测试中表现优于参数规模达24倍的竞品。据研究团队介绍,Ferret-UI Lite专为跨平台图形用户界面(GUI)交互设计,通过实时裁剪技术、合成训练数据生成和强化学习等创新方法实现突破。

背景与技术改进

2023年12月,苹果研究团队首次推出Ferret模型,该多模态大语言模型可精准解析图像中的自然语言引用。随后团队陆续发布了Ferretv2、Ferret-UI和Ferret-UI 2等升级版本,重点解决通用多模态模型在UI界面理解中的局限性。最新推出的Ferret-UI Lite采用“任意分辨率”技术,通过局部区域裁剪和放大,弥补小参数模型处理图像信息的不足。

训练机制创新

研究团队构建了多代理训练系统,自主生成合成训练数据。该系统包含课程任务生成器、规划代理、界面交互代理和评估模型,完整模拟真实用户操作中的模糊状态(如错误处理、意外恢复等)。尽管Ferret-UI Lite在单步骤低级别任务中表现优异,其在复杂多步骤交互上的能力受限,这与小模型的硬件约束相符。

应用价值与挑战

作为运行在终端设备上的本地化代理,Ferret-UI Lite无需上传数据至云端,显著提升用户隐私保护水平。当前版本主要针对Android、网页和桌面环境进行训练与测试,使用AndroidWorld和OSWorld等基准。研究团队未明确说明未采用iOS界面数据的原因,但可能与开源测试平台的规模相关。

编辑点评

苹果此次推出的Ferret-UI Lite标志着终端侧AI发展的重要里程碑。在隐私保护与边缘计算需求激增的背景下,30亿参数的轻量化模型性能超越行业巨头的云端大模型,或将推动AI技术从中心化向分布式架构转型。

该研究的国际意义在于打破了传统认知:小模型通过创新训练方法仍能实现与大模型相当的交互能力。这种技术路径对资源受限的设备(如物联网终端)具有普适性,可能引发全球AI研发范式调整。同时,苹果选择Android、网页等非封闭系统进行训练,暗示其意图在跨平台通用性上建立技术优势,这与谷歌、微软等企业争夺AI生态主导权的战略形成竞争。

从市场影响看,本地化处理能力的提升有助于推动AI在金融、医疗等敏感领域的落地。但小模型在复杂任务中的局限性仍需警惕——若无法突破多步骤交互瓶颈,终端AI恐难替代云端解决方案。未来需关注开源社区对Ferret模型的改造潜力,以及中美科技企业在这场AI轻量化竞赛中的技术博弈。

相关消息:https://9to5mac.com/2026/02/20/apple-researchers-develop-on-device-ai-agent-that-interacts-with-apps-for-you/