中国AI企业商汤科技发布高速图像模型SenseNova U1
商汤科技(SenseTime)于2026年4月29日发布全新开源图像模型SenseNova U1,声称其在图像生成与理解速度上超越美国主流AI模型,旨在重振其在中国人工智能领域的领先地位。
该模型采用创新架构NEO-Unify,能够直接处理图像数据,无需先转换为文本,从而大幅降低计算资源消耗并提升推理效率。商汤科技联合创始人兼首席科学家林达华表示:“模型的整个推理过程不再局限于文本,它能直接用图像进行推理。”
林达华同时强调,该技术将有助于机器人更高效地理解物理世界。他指出,当机器人面对复杂环境时,需整合大量视觉信息以判断操作,如“若前方有复杂机器,应按哪个按钮”,而SenseNova U1的图像原生处理能力可提升决策速度与准确性。
据商汤科技公布的测试数据,SenseNova U1生成图像质量优于当前所有开源模型,性能接近阿里巴巴Qwen和字节跳动Seedream等国内闭源模型,但略逊于一周前发布的GPT-Image-2.0。其核心优势在于处理速度与轻量化设计,可部署于PC及移动设备。
模型发布当天,寒武纪、壁仞科技等10家中国芯片企业宣布其硬件已支持U1,表明该模型兼容国产芯片。林达华表示,尽管面临美国出口管制限制,商汤仍将推动在更多国产芯片上进行训练,但承认“为保障迭代速度,仍可能需要使用最先进的芯片”。
商汤科技将U1免费开源于Hugging Face与GitHub平台,显示出中国企业在开源AI领域的活跃度提升。公司近年来因面部识别技术被美国制裁,限制美国企业对其投资与技术出口,但通过开源策略,商汤希望绕过地缘政治障碍,与国际研究社区持续合作。
该公司成立于2014年,曾是计算机视觉领域全球领导者,但在大语言模型兴起后利润下滑,被DeepSeek、MiniMax等新兴企业超越。此次开源U1,是其加快技术迭代、追赶国内外领先企业的关键一步。林达华称,公司去年决定转向开源,以获取研究社区反馈,从而加速模型优化。他指出:“在当今时代,开源或闭源已非决定性因素,关键是迭代速度。”
商汤科技正与ACE Robotics(由另一名联合创始人创立的机器人初创企业)紧密合作,推动模型在人形机器人领域的应用。此外,公司也在开发专注于地理空间理解的模型,用于构建真实世界模拟。
编辑点评
商汤科技发布SenseNova U1模型,标志着中国在AI基础模型与国产化芯片协同上的重要进展。该模型通过图像原生处理架构突破了传统文本-图像转换瓶颈,为机器人、自动驾驶等场景提供更高效推理能力,具有显着技术前瞻性。在中美科技脱钩背景下,中国AI企业正加速构建自主技术栈,U1对国产芯片的兼容性强化了这一趋势,凸显中国在AI芯片-模型-应用生态闭环上的战略布局。同时,开源策略既是技术开放的体现,也是应对美国制裁的软性突围——通过国际学术合作维持技术交流,降低地缘政治对研发的干扰。尽管性能仍落后于GPT-Image-2.0等顶尖模型,但U1在速度与轻量化设计上的优势,使其在边缘计算与嵌入式AI场景中具备独特竞争力,或将在人形机器人等新兴领域形成差异化突破。未来若能与国产算力平台深度整合,或将重构全球AI基础设施格局。