Anthropic公司近日宣布了一项重大更新,推出了两款全新的AI模型:升级版的Claude 3.5 Sonnet和全新的Claude 3.5 Haiku。这次更新不仅带来了性能的全面提升,更引入了突破性的计算机使用功能,标志着AI技术的新一轮进化。
Claude 3.5 Sonnet:革命性突破
升级后的Claude 3.5 Sonnet在各方面都超越了前代版本,尤其是在编码领域取得了显著进展。在SWE-bench Verified测试中,其得分从33.4%跃升至49.0%,超越所有公开模型。这一进步使其在编码能力上超越了O1-mini和O1-Preview,成为当前市场上最强的编码AI之一。
最引人注目的是Claude 3.5 Sonnet引入的计算机使用功能。通过Sonnet API,AI现在可以像人类一样操作计算机:查看屏幕、移动光标、点击按钮和输入文本。这一功能的工作原理包括四个主要步骤:
-
明确工具和任务
-
Claude选择使用工具
-
提取工具信息,运行工具并返回结果
-
继续使用工具直到完成任务
在OSWorld基准测试中,Claude 3.5 Sonnet的表现远超其他AI系统,展示了其强大的计算机操作能力。这一功能的开发,为AI与计算机软件的交互解锁了大量当前一代AI助手无法实现的应用,使得AI模型能够遵照指示使用几乎任何软件。
Claude 3.5 Haiku:SOTA技术与性价比和速度的结合
全新的Claude 3.5 Haiku在许多评估中的性能与Claude 3 Opus(他们之前最大的机型)不相上下,而成本和速度却与上一代Haiku相当。Claude 3.5 Haiku在编码任务上尤其强大,在SWE-bench Verified上的得分为40.6%,超过了使用公开可用的SOTA模型的许多智能体。
定价信息
Claude 3.5 Sonnet的定价如下:
-
正常使用:输入$3/100万token,输出$15/100万token
-
命中缓存:输入$3.75/100万token,输出$0.30/100万token
这次更新,不仅在技术上实现了重大突破,也在商业应用上提供了更多可能性。开发者可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用这些新模型进行构建。
目前智创聚合API已支持claude-3-5-sonnet-20241022模型,可接入使用,官方地址:https://s.lconai.com/
请登录之后再进行评论