Magentic-UI：以人为中心的AI助手-中关村在线

Magentic-UI：以人为中心的AI助手

拿铁不加冰

原创

2025-05-20

微软研究院近日推出了一款名为 Magentic-UI 的开源研究原型。该系统是一种以人为中心的 AI 智能体，旨在通过网页浏览器为用户提供实时协助，完成各类复杂的在线任务。

随着现代工作日益依赖网络操作，不论是信息检索、表单填写还是仪表板管理，用户往往需要进行大量重复且耗时的手动操作。Magentic-UI 的设计初衷即是辅助用户更高效地处理这些任务，同时也为研究人员提供一个平台，以深入探讨人机协作机制及 AI 智能体监管等前沿课题。

与追求完全自动化的 AI 工具不同，Magentic-UI 更加注重透明度和可控性，确保用户在使用过程中始终掌握主导权。该系统构建于 2024 年推出的 Magentic-One 多智能体架构之上，借助 AutoGen 框架实现运行，具备协同规划、任务协作、行为控制和经验学习四大关键能力。

在协同规划功能中，用户可以通过计划编辑工具调整 AI 所制定的操作步骤；而在执行过程中，用户也能随时介入，暂停任务、提出反馈，甚至直接接管浏览器进行手动操作。行为控制机制则保证 AI 在执行重要操作前必须获得用户确认，避免不可逆后果。经验学习模块使系统能够回顾过往任务，总结并存储有效方案，从而提升未来操作的效率。

Magentic-UI 的架构由多个专业智能体组成，包括负责整体协调的 Orchestrator、操作浏览器的 WebSurfer、执行代码的 Coder 和管理文件的 FileSurfer。整个系统运行在 Docker 沙箱环境中，防止对主机系统造成影响。同时，用户还可以设置网站访问白名单，并在任何时候终止正在进行的任务。系统的安全性也经过严格测试，在模拟攻击中成功抵御了多种常见网络安全威胁。

该系统展示了未来人机协作在网页操作场景中的潜力，也为相关研究提供了新的方向和技术基础。

展开全文