谷歌Gemma 4模型通过预测未来令牌实现三倍速度提升
谷歌于今年春季发布Gemma 4开源AI模型,旨在提升本地AI性能。近日,谷歌推出多令牌预测(MTP)草案模型,利用推测性解码技术预判未来令牌,显着加速生成过程。该技术在不牺牲输出质量的前提下,将推理速度提升至原来的三倍。Gemma 4基于与前沿Gemini模型相同的底层技术,但专为本地运行优化,可适配消费级GPU。谷歌同时将Gemma 4许可证更新为Apache 2.0,增强开放性。MTP通过轻量级草案模型(如7400万参数的E2B)在主模型计算间隙生成推测令牌,结合共享键值缓存和稀疏解码技术,有效提升效率。
2026-05-07 01:04
DeepSeek发布V4大模型:性能逼近顶尖水平 成本仅为竞品六分之一
中国人工智能初创企业DeepSeek于2026年4月26日晚发布其最新大模型DeepSeek-V4,该模型具备1.6万亿参数,采用混合专家(MoE)架构,采用MIT开源许可证免费开放,支持商业应用。据 VentureBeat 报道,DeepSeek-V4在多项基准测试中表现接近甚至超越当前全球最先进的闭源系统,如GPT-5.5和Claude Opus 4.7,同时通过API调用成本仅为后者约六分之一。其Pro版本每百万输入输出token仅需5.22美元,相较GPT-5.5的35美元和Claude Opus 4.7的30美元大幅降低。DeepSeek研究人员陈德利在X平台称此为“484天的...
2026-04-28 00:06
DeepSeek发布V4大模型:开源、长上下文与国产芯片适配成三大亮点
中国人工智能企业DeepSeek于2026年4月24日发布其新一代旗舰模型V4,该模型支持100万 tokens上下文长度,具备高效记忆机制,且首次全面适配国产AI芯片,如华为Ascend。V4提供V4-Pro和V4-Flash两个版本,均为开源,推理成本显着低于OpenAI、Anthropic等主流闭源模型,其中V4-Flash每百万输入token仅需0.14美元。性能方面,V4-Pro在多个基准测试中追平GPT-5.4、Claude-Opus-4.6等顶尖闭源模型,并超越阿里巴巴Qwen-3.5、Z.ai GLM-5.1等国内开源模型。技术上,V4通过优化注意力机制,大幅降低长上下文...
2026-04-25 06:03
中国DeepSeek发布备受期待的V4大模型预览版 人工智能竞赛持续升温
中国人工智能初创企业DeepSeek于2026年2月26日发布其备受期待的V4大语言模型预览版,该模型为开源版本,支持本地运行与修改,适用于代理工具如Anthropic的Claude Code和OpenClaw。DeepSeek称V4在代理任务、知识处理和推理方面表现优异,且优化了性能。该公司此前推出的R1推理模型因成本低、性能强而引发全球科技市场震动。此次V4发布进一步加剧中美在人工智能领域的技术竞争,公司未向美国工程师提供早期访问权限,而是优先开放给中国企业。DeepSeek成立于2023年,其V3模型于2024年底免费开源,训练成本远低于OpenAI和谷歌等美国企业。尽管面临阿里巴...
2026-04-24 13:02
Meta发布首个人工智能模型Muse Spark,由Alexandr Wang领导研发
Meta于2026年4月8日发布其首个由Alexandr Wang领导研发的人工智能模型Muse Spark。该模型历时九个月开发,定位高于Llama 4,将立即用于Meta AI应用程序和Meta.ai网站的查询服务,并计划扩展至Facebook、Instagram和WhatsApp。Muse Spark支持语音、文本和图像输入,但仅输出文本。模型具备快速模式和多种推理模式,包括专为购物场景优化的“购物模式”,整合用户兴趣与行为数据。Meta还计划开源该模型版本。Wang现年29岁,曾共同创立Scale AI,去年加入Meta的‘超级智能’团队,旨在缩小与OpenAI及Anthropi...
2026-04-09 03:07
Anthropic 发出版权删除通知要求移除8000多个Claude Code源代码副本
人工智能公司Anthropic因源代码意外泄露,已向GitHub等平台发出版权删除通知,要求移除超过8000个Claude Code源代码副本及其衍生版本。泄露代码包含AI模型运行指令,如“梦境”记忆整合机制、伪装为人类用户发布代码的指令,以及指向未来产品的标签,甚至包含一个名为“Buddy”的交互式宠物系统。部分开发者利用AI工具将功能重写为其他编程语言,以规避删除,新版本在GitHub上迅速流行。事件引发对AI公司知识产权保护与开源共享边界争议。
2026-04-02 02:06
欧洲启动开源办公套件项目Euro-Office 拟替代Google Docs及微软Office
欧洲多家科技企业联合发起开源项目Euro-Office,旨在打造支持主流文档格式的在线办公套件,推动数字主权。该项目基于OnlyOffice代码库进行硬分叉,强调自主可控,但引发OnlyOffice方面关于版权及品牌标识移除的争议。Euro-Office支持DOCX、PPTX、XLSX及ODT等格式,设计风格贴近微软Office,可集成至Nextcloud、Proton等云存储平台。其发起方包括Nextcloud、EuroStack、Wiki、Proton、Soverin、Abilian等欧洲公司。OnlyOffice CEO Lev Bannov指出,Euro-Office移除了其品牌...
2026-04-01 00:08
OpenClaw引发AI模型商品化担忧:开源项目成行业焦点
奥地利开发者Peter Steinberger创建的开源AI助手OpenClaw在三个月内迅速崛起,成为全球关注焦点。Nvidia首席执行官黄仁勋在GTC大会上称其为‘人类历史上最受欢迎的开源项目’,并将其比作‘下一个ChatGPT’。OpenClaw支持开发者在本地设备上运行AI代理,连接WhatsApp、Telegram等通讯平台,实现自动化任务。该技术的普及暴露了大型语言模型可能正在商品化的趋势,促使OpenAI和Anthropic等巨头加速推出类似功能。Nvidia推出免费安全服务NemoClaw以推动企业采用,而开发者Gavriel Cohen则基于OpenClaw开发出Nan...
2026-03-21 21:11
自由软件基金会指控Anthropic侵犯版权:呼吁开源大型语言模型训练数据
2024年,Anthropic因在训练大型语言模型(LLM)时涉嫌侵犯版权被起诉。近日,自由软件基金会(FSF)宣布,其持有的版权作品《自由如自由:理查德·斯托曼的自由软件运动》被纳入Anthropic的训练数据。该书由O'Reilly出版,FSF在GNU自由文档许可证(GNU FDL)下持有版权,允许免费使用。FSF强调,应保障计算自由,要求Anthropic及其他LLM开发者公开完整训练数据、模型、配置及源代码。FSF表示,虽资源有限,但若参与如Bartz v. Anthropic等诉讼,将要求以用户自由作为赔偿。FSF声明:‘我们通常不因版权侵权提起诉讼,但若起诉,我们只为自由而战。’
2026-03-16 14:02
Python 'Chardet' 包被LLM重写并重新许可引发开源社区争议
Python开源包'chardet'的维护者于近期发布7.0版本,声称实现43倍性能提升,并称其为MIT许可证下的全新重写。然而,社区发现该版本实际上是由现有代码和测试套件通过Claude大型语言模型生成,引发关于版权归属与开源许可合法性的广泛争议。原版本6及更早版本采用LGPL许可证,新版本则转为MIT许可证。维护者援引Oracle v. Google案中关于API克隆属于合理使用的判决,但未提供‘洁净室’开发证据。此外,LLM输出的版权归属尚无定论,法院近期倾向认为其不具可版权性。该事件在GitHub上引发激烈讨论,质疑是否可通过LLM‘清洗’开源代码并重新授权,从而规避原有开源社区权益。
2026-03-07 03:05