智谱华章科技有限公司今日发布了一款名为GLM-PC的多模态大模型CogAgent,宣称其具备自主操作电脑的能力。这款产品基于Cognition Intelligence Technology (CIT)的大模型技术,并且是全球首个面向公众、回车即用的电脑智能体(agent)。据官方介绍,GLM-PC能够像人类一样观察和操作计算机,协助用户完成各类电脑任务。
该产品具有代码生成与逻辑执行、规划等功能,并支持综合分析目标以及可用资源,生成执行路线图,并将大型任务自动分解为可管理的子任务以构建出清晰的执行路径。同时,它还支持启动代码生成模块、执行逻辑循环,逐步推进任务完成,并具备长思考能力,如实时调整、反思修正和自我纠错等。
此外,在图像与GUI认知方面,GLM-PC准确识别图形界面元素并理解其功能与交互逻辑;同时进行深入语义分析以提取关键信息;并且能够融合图像与文字信息形成全面感知结果。目前GLM-PC已经开放了内测,并将于2024年11月29日正式发布并开放市场。
评论