要点
本周 Anthropic 和 Google 几乎同时发布了重磅模型更新:Claude Sonnet 4.6 和 Gemini 3.1 Pro,两者都在推理和编码能力上有显著提升。
Claude Sonnet 4.6
Anthropic 发布的 Claude Sonnet 4.6 在多个维度有提升:
- 编码能力增强,computer use 技能大幅改善
- 长上下文推理更强,支持 100 万 token 上下文窗口(beta)
- Agent 规划和知识工作能力提升
- 已成为 claude.ai 和 Claude Cowork 的默认模型
- 价格不变:输入 $3/百万 token,输出 $15/百万 token
Anthropic 表示:「以前需要 Opus 级别模型才能完成的任务,现在 Sonnet 4.6 就能胜任。」
Gemini 3.1 Pro
Google 发布的 Gemini 3.1 Pro 重点在核心推理能力:
- 在 ARC-AGI-2 基准测试中得分 77.1%,是 3 Pro 推理性能的两倍多
- 已在 Google AI Studio、Gemini CLI、Vertex AI、Gemini 应用等平台上线
- 定位为「更智能、更强大的复杂问题解决基线」
AI 观点
模型能力的快速迭代对用户是好事——竞争越激烈,价格越合理,功能越强。对于 ChatGPT 用户来说,了解竞品动态有助于做出更明智的工具选择。