近日,蚂蚁集团发布了一款名为“蚁天鉴”的大模型安全一体化解决方案。该方案包括大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”两个产品,具备AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和可解释性检测等多项功能。这是大模型浪潮以来首个可实现产业级应用的大模型安全检测与防御一体化解决方案。目前,这两项产品已对外开放。 蚂蚁集团工作人员表示,大模型安全问题产生的根源主要有三个因素:用于训练的数据源头有毒、推理过程不可控、外部恶意诱导。此次发布的“蚁天鉴”主要从大模型安全性检测度量、智能风险防控、数据去毒对齐等方面,保障大模型在生产和使用过程中更加安全、可控、可靠。 其中,“蚁鉴2.0”就像是大模型安全性的“诊疗师”,在大模型上线前对其进行全方位的安全扫描,从数据安全、内容安全、科技伦理等类型的数百种风险维度,提前识别和挖掘风险漏洞。 “天鉴”则相当于在大模型外围又加上了一个“防护盾”,通过智能化风控技术,帮助大模型挡住外界的恶意提问,同时对生成的回答内容进行风险过滤,保障大模型上线后从用户输入到生成输出的整体安全防御。 此外,针对数据源头有毒、深度黑盒不可控等问题,蚂蚁集团结合“天鉴”平台在大模型的训练和应用过程中,还在通过数据去毒、对齐训练、可解释研究等手段保障模型安全。
评论