Anthropic,OpenAI的主要竞争对手,最近发布了其最新版本Claude 3.5的升级版。其中最引人注目的是新增的Claude 3.5 Sonnet模型,该模型能够模拟人类与计算机之间的交互方式。
这一功能的实现,得益于Anthropic推出的一个API,它使得Claude能够感知并与计算机界面进行互动。开发者们可以通过集成这个API,将用户的指令转化为可以被计算机执行的指令。
在OSWorld基准测试平台上,使用了新API的Claude 3.5 Sonnet在仅使用截图进行测试时,在“仅使用截图”的类别中获得了14.9%的得分,远远超过了排名第二的7.8%。
当任务允许有更多的步骤时,Claude 3.5 Sonnet的得分达到了22%,尽管这一成绩仍不及人类水平,但在人工智能领域已经是一个重大的突破。
Anthropic公司表示,目前这一功能的操作速度较慢且偶尔会出错,但考虑到这只是测试阶段,他们的主要目标是收集开发者的反馈,以便未来能够不断改进。
评论