AI技术新纪元：Anthropic发布Claude 3.5 Sonnet和Haiku，开启编码与计算机操作新篇章

AI导读

Anthropic公司发布Claude 3.5系列AI模型，包含升级版Sonnet与全新Haiku版本，推动AI技术在编码与计算机操作领域的革新。Claude 3.5 Sonnet通过SWE-bench测试验证其编码能力跃居行业首位（49%准确率），并首创计算机操作功能，可模拟人类执行屏幕操作、光标移动及软件交互，在OSWorld基准测试中展现领先的系统操控能力。Claude 3.5 Haiku则在保持成本效率的同时，性能接近前代顶级模型Opus，编码准确率达40.6%。两款模型已通过主流云平台开放商用，为开发者提供更强大的AI工具选择。

Anthropic公司近日宣布了一项重大更新，推出了两款全新的AI模型：升级版的Claude 3.5 Sonnet和全新的Claude 3.5 Haiku。这次更新不仅带来了性能的全面提升，更引入了突破性的计算机使用功能，标志着AI技术的新一轮进化。

Claude 3.5 Sonnet：革命性突破

升级后的Claude 3.5 Sonnet在各方面都超越了前代版本，尤其是在编码领域取得了显著进展。在SWE-bench Verified测试中，其得分从33.4%跃升至49.0%，超越所有公开模型。这一进步使其在编码能力上超越了O1-mini和O1-Preview，成为当前市场上最强的编码AI之一。

最引人注目的是Claude 3.5 Sonnet引入的计算机使用功能。通过Sonnet API，AI现在可以像人类一样操作计算机：查看屏幕、移动光标、点击按钮和输入文本。这一功能的工作原理包括四个主要步骤：

明确工具和任务
Claude选择使用工具
提取工具信息，运行工具并返回结果
继续使用工具直到完成任务

在OSWorld基准测试中，Claude 3.5 Sonnet的表现远超其他AI系统，展示了其强大的计算机操作能力。这一功能的开发，为AI与计算机软件的交互解锁了大量当前一代AI助手无法实现的应用，使得AI模型能够遵照指示使用几乎任何软件。

Claude 3.5 Haiku：SOTA技术与性价比和速度的结合

全新的Claude 3.5 Haiku在许多评估中的性能与Claude 3 Opus（他们之前最大的机型）不相上下，而成本和速度却与上一代Haiku相当。Claude 3.5 Haiku在编码任务上尤其强大，在SWE-bench Verified上的得分为40.6%，超过了使用公开可用的SOTA模型的许多智能体。