近日,有科技媒体报道称,人工智能研究机构 Hugging Face 推出了名为 Open Computer Agent 的免费云端智能工具。该工具支持用户通过文本指令远程操作基于 Linux 系统的虚拟计算机,并可运行如 Firefox 等常见应用程序。
这款工具融合了 smolagents、Qwen2-VL-72B(一种视觉语言模型)以及 E2B Desktop 等多项技术,能够实现诸如打开应用等基本操作。根据介绍,Open Computer Agent 预装了 Firefox 浏览器等常用软件,用户可通过简单的英文命令,如访问特定网站或查询导航路线等方式进行交互。
尽管工具在执行简单任务时表现良好,但在应对复杂操作时仍存在不足。初步测试反馈显示,其响应速度偏慢,系统稳定性也有待提升,特别是在处理 CAPTCHA 验证时容易出错。
目前,该工具已对外公开,但因使用需求旺盛,部分用户可能需排队等候体验机会。Hugging Face 方面表示,推出这一工具的目的并非追求极致完善,而是为了展现开源模型在云环境中的性能潜力和成本效益。

评论
更多评论