在数字化转型不断提速的发展背景下,数智应用及服务的辐射范围也随之越来越广,数据正在成为推动数字经济高质量发展的关键力量;但犹如硬币的两面一样,数字技术的发展也具有其两面性,在我们享受数字经济红利的同时,也面临着数据泄露、数据滥用等巨大的数据安全压力。
随着数据应用场景的不断拓展深化,数据流动的量级和频率也日益激增,巨大的流量和访问频率背后是无法估量的数据安全风险。作为宝贵的生产要素,如果通过限制数据流动,或者设置数据流动壁垒,不仅会造成严重的资源浪费,甚至不利于发挥数据要素的价值。显然,数据开放和数据安全之间存在着矛盾和失衡。
流动是实现数据价值的前提,既需有序促进数据要素的开发利用,也要依法依规坚守数据安全的底线。在复杂的数据风险环境下,企业或组织需要研究落地新的数据安全防护体系,将安全能力嵌入于数据流动生态中的每个节点中,从数据动态流转的各个环节中强化数据安全防护能力。在这个过程中,解决数据流动可见性是首要先决条件。
数据流动可见不仅是数据流动安全建设的基础底座,事实上,从监管合规层面来看,解决数据流动可见也是企业的必由之路。不论是《数据安全法》明确了国家建立数据分类分级保护制度,要求对数据实行分类分级保护;还是《个人信息保护法》对个人信息的处理活动进行记录进行了明确要求,抑或是《数据出境安全评估办法》强调企业要进行数据风险自评估,都是对落实数据流动可见的重要指引和必要要求。
一、如何理解数据流动可见
企业在持续的发展过程中会累积海量的数据,这些数据结构类型多,流转场景也很复杂。从数据安全角度来说,「数据可见」关注的是数据的发现和“敏感数据”的识别,能够让企业清晰自己需要保护的数据资产和需要保护的级别;「流动可见」描述的是这些数据资产在数据服务之间,通过数据接口进行传递、处理和存储等过程。
数据流动可见的关键是基于数据发现和分类分级,对企业当前的数据服务和数据接口进行梳理,同时关联数据处理活动核心要素信息如数据范围、数据处理目的、数据处理结果等,明确企业敏感数据及重要数据的业务场景化安全要求,快速构建数据流动可见能力和数据流动风险监测能力。
在业务视角下,企业需要关注数据资产、数据服务、数据接口等要素的逻辑关系,动态掌握数据流转状态。
l数据资产:指一个组织或企业拥有的数据集合,这些数据在经过适当处理、分析后可以生成价值,帮助组织做出更好的决策或优化业务流程。银行的数据资产可能包括客户信息、客户风险评级、客户服务记录等。
l数据服务:一种通过网络提供数据访问和操作的服务,能让用户可以通过简单的网络连接获取、操作和分析数据,包括数据存储和查询、数据挖掘、数据分析、数据清洗等。
l数据接口:是数据服务对外提供的服务暴露面,也是数据流动的关键技术。数据接口使得用户可以通过编程方式访问和操作数据,如银行可能通过API接口,提供给第三方支付平台账户余额查询和资金转账等服务。
二、数据流动可见四大难点
通过对真实数据安全建设实践的观察发现,对于大部分企业来说,要真正落地数据流动可见能力是一件极具挑战的事情,主要原因集中表现在以下4点:
● 数据源的多样性:企业通常从多个数据源获取数据,这些数据源可能具有不同的格式、结构和API,处理来自不同数据源的数据并将其整合起来是一项挑战,需要解决数据源兼容性、数据转换和数据映射的问题,确保数据的一致性和准确性。
● 业务和数据的多样性:不同业务领域和部门的数据需求和数据类型可能多样化,这涉及到不同业务流程、数据结构和业务规则的理解和整合。
● 业务和数据的多变性:企业业务数据可能会频繁变化,包括新增字段、修改数据模型、业务规则的调整等,增加了数据流动识别复杂性和敏感性,需要具备灵活的数据流动识别机制,能够快速适应业务数据的变化,确保数据的准确性和及时性。
● 实施人力成本:构建完整和实时的数据流动信息需要投入人力和资源。处理数据源的多样性、网络架构的复杂性以及业务和数据类型的多样性需要专业的技能和知识。
三、构建数据流动感知大脑
数据安全不仅是合规要求,更是支撑业务发展的动力。在面临诸多难点的情况下,以业务为导向,建设以数据流动可见为内核的全链路数据流动安全能力体系,是企业有效落实数据安全治理的破局之道。
全链路数据流动安全能力体系建设的核心是在持续的数据发现和分类分级的基础上,关注数据资产内外部流转状态,对数据的流转、交互进行链路构建,形成整体数据流动的安全态势,并将链路的构建结果应用于业务场景化的风险监测和治理,同时,在数据安全治理机制上实现动态更新和统一管理。
基于全息数据资产发现的结果,汇聚多个单点能力实现自动化的敏感数据识别及数据流动链路刻画,帮助企业构建全量数据资产和流动感知网,形成实时感知、全域管理的数据流动感知大脑,实现数据流动链路的清晰可见和交互分析;同时通过持续扫描和暴露面风险监测的手段,动态完成资产扫描和暴露?更新,及时感知数据资产和数据流动的变化,适时开展数据风险治理及合规评估等工作,提升数据要素深度利用和安全保护的水平。
四、数据流动可见实践方法
企业在构建数据流动感知大脑的时候通常需要依赖专业的技术方式来实现,以下几种实践技术可以参考借鉴:
1、问卷调研和访谈:问卷调研和访谈是咨询服务机构常见的分析数据流动可见的方式。通过对相关的产品经理和研发人员进行访谈,收集和汇总数据和流动相关的信息,形成企业数据流动的架构图
2、主动扫描模式:通过技术工具对目标范围进行系统性的扫描,发现其中的数据服务和数据资产信息;基于对企业数据类型和范围的收集、分析、处理,能够帮助企业做出合理的保护策略
3、流量监测模式:通过使用网络流量分析工具和技术的方式,捕获和监测企业网络中的数据流动情况,适用于分析企业内部网络和外部通信的数据流动情况,监测数据的传输路径、数据来源和数据的目的等信息
4、插桩模式:一种在应用程序中插入代码或工具,以监测、记录和分析数据流动的方式。通过在关键位置插入代码,捕获和跟踪数据在应用程序内部的流动情况,并生成数据流动的可见架构图,适用于分析和监测应用程序内部的数据流动
解决数据流动可见并不是简单的公式模版,即便掌握了技术方法,仍需要避开建设误区,结合行业规范、业务场景等进行针对性设计落地,这对企业来说无疑是种考验。那么,企业在落实数据流动可见能力的路上应该避开哪些“坑”呢?
1、 避免盲目求全
企业需要关注敏感数据的识别,而非全量业务数据的分类:在构建数据流动的可见性时,重点关注敏感数据的识别和追踪,将精力集中在敏感数据的流动路径、使用情况和安全控制上,以确保对敏感信息的全面管理和保护。
优先关注数据源头和数据出口:因为企业生产网络域内部的数据流动非常复杂,要实现全面完整的梳理成本很高,从数据安全角度来看,应当重点关注数据的来源和最终去向(应用和API的数据流动),这可以大幅的减少构建数据流动视图的成本。
2、避免打扰业务
避免对生产业务系统进行改造或者造成影响:插桩方案部署成本非常高,需要在应用程序中插入额外的代码或修改字节码,这可能会对应用程序的原有逻辑和性能产生影响。因此,在非必要场景下,不宜采用插桩模式。
3、避免过度人力投入
通过机器学习不断沉淀经验:利用机器学习和数据分析技术,不断沉淀和学习数据流动的模式和规律;建立基于机器学习模型的数据流动分析系统,自动化识别敏感数据和数据流动,减少对人工参与的依赖,提高数据流动可见性效率和准确性。
自动化工具和流程:采用自动化工具和流程,可以降低人力投入的成本和风险。通过选择、部署适当的数据流动分析工具,可以实现数据的自动收集、清洗、转换和分析。
数字化发展进程不可逆转,数据流动的受阻,意味着依赖数据流动创造的产业发展、技术创新、生活生产等,都会受到巨大影响。以数据流动可见为内核,打造兼顾业务可用性与数据流动风险可控性之间平衡的数据风险治理体系,推动数据自由安全地流动,最大程度地挖掘和释放数据价值。
全知科技《数据安全作战地图——数据流动可见》知识图谱已正式发布,图谱针对数据流动可见业务难点、技术方法、实践思路、避坑指南等内容模块,摘取、关联、归纳关键理论知识和实践要点,具备强可视化的学习能力和分析能力,帮助企业建立体系化的数据安全建设思维。
评论