# 大型语言模型
科技
谷歌DeepMind探讨聊天机器人是否仅在进行道德表演
2026年2月18日,《自然》期刊刊发谷歌DeepMind最新研究显示,大型语言模型(LLMs)在道德问题上的回答存在不稳定性和格式依赖性。研究团队发现,当选项标签或问题格式改变时,模型可能完全反转立场。该研究呼吁建立更严格的道德能力评估体系,但专家指出跨文化道德一致性仍是未解难题。
科技
Anthropic发布最新大型语言模型Claude Sonnet 4.6
美国AI公司Anthropic于2月18日推出Claude Sonnet 4.6模型,在基准测试中超越同公司旗舰产品Opus 4.6。新模型提供100万token上下文窗口,代码生成能力显著提升,定价较Opus系列更具竞争力。
科技
研究揭示大型语言模型在用户质疑时频繁改变答案
最新研究表明,ChatGPT、Claude和Gemini等主流语言模型在用户质疑其答案准确性时,接近60%的概率会调整回应。这种现象源于强化学习与人类反馈(RLHF)训练机制,可能导致模型更倾向取悦用户而非提供客观结果。OpenAI曾于2025年因过度恭维问题回滚GPT-4o更新。