12月16日,由国家信息中心《信息安全研究》杂志社主办,公安部第一研究所、中国网络安全产业联盟、新华网客户端等单位共同协办的“2021网络安全创新发展高峰论坛”在京顺利举行。
北京明朝万达科技股份有限公司助理总裁兼研发中心总经理安鹏受邀出席此次会议,并在数据安全分论坛以“AI技术在数据安全治理的应用与探索”为题发表演讲,向与会领导、专家们分享了明朝万达在AI技术在数据安全治理的应用和实践,介绍了公司成功的应用效果和项目实践。
近年来国内外数据泄露事件频发,为了使数据合法合规使用,充分发挥价值,国家出台了多项政策法规要求加强针对数据的安全管理,数据安全治理势在必行。作为国内数据安全领域的代表厂商,明朝万达认为数据安全治理需要由政府、企业组织牵头,以策略规范和技术工具为支撑,围绕数据生命周期,经过组织梳理、资产梳理、策略制定、过程控制、行为稽核、持续完善六个阶段进行,从而让数据使用更安全。
安鹏讲到,数据安全治理并非仅由单一产品或平台所构建,而是围绕数据生命周期,结合企业或组织自身数据现状,建立与制度流程配套的技术和工具,持续提升企业或组织的数据安全防护能力。他一一列举了当前政府机构在数据安全治理六个阶段分别需要具备的技术能力,然后挑选其中数据资产识别、数据分类分级、异常行为分析、数据指纹溯源、控制策略推荐5项技术能力,逐一介绍了明朝万达是如何用AI为其赋能的。
数据资产识别
政务系统中包含丰富的高敏感数据,但不同部门间数据标准不一,文件数量庞大、类型多,所涉及专业知识存在差异,人工难以实现自动化对敏感信息进行识别。传统数据资产识别方式主要采用正则表达式技术手段,依靠人工经验,设定数据资产识别规则,存在工作量大、实施难度大、误报、漏报率高的问题。
应用AI技术,使用自然语言处理技术,在正则表达式基础上,分析上下文语义,识别敏感数据,具备识别类型宽泛、识别颗粒度细、识别准确度高的优势。
应用效果:
数据分类分级是数据安全治理的重要环节,数据分级后才能根据访问权限在安全的前提下使用,推动数据跨部门、跨层级的共享共用。传统数据分类分级主要依据文件名中关键字或员工经验核验文件内容对数据进行分类分级,此种方式存在分类依据欠缺、类别结构混乱、校验工作量大的问题。
应用AI技术,基于文件内容,使用自然语言处理技术,构建N元中文语言模型与文档分类模型,具备分类依据充分、统一分类结构、自动分类分级的优势。
实现效果:
异常行为分析
异常行为分析通过分析内部用户产生的行为日志,如操作日志、审批记录等数据,检测并发现异常访问行为,分析并追溯异常产生原因,从而防范敏感数据泄露与数据滥用的安全风险。传统方式是在发现安全事件后,主要通过人工依据企业组织软硬件日志来进行分析用户行为,存在事后分析滞后、行为日志数量大、关联分析难度大的问题。
应用AI技术,基于UEBA框架,使用机器学习、深度学习模型,构建用户行为基线,判断异常行为,具备分析用户行为全面、发现异常行为及时的优势。
实现效果:
数据指纹溯源
数据指纹技术能够基于数据内容生成数据指纹。数据指纹能够使用较少的存储容量,快速识别文件的相似性。即便员工违规拷贝并泄露敏感数据,也能通过对比数据指纹,对原始文件进行匹配溯源。传统的数据溯源,主要通过一对一的扫描比对方式对数据文件的内容进行对比,存在数据溯源范围大、数据比对时间长、全面溯源成本高的问题。
应用AI技术,基于自然语言处理方法及特征提取技术,构建数据指纹库,具备指纹特征存储容量小 、数据唯一标识、识别数据快速且高效的优势。
实现效果:
控制策略推荐
为保障政务系统安全,安全管理人员需要配置大量的控制策略。目前控制策略的配置与下发,均采用人工的方式进行操作,主要依靠安全管理人员的经验以及各部门员工的要求,此种方式不仅对运维人员的经验要求高,在多次更改个人或部门的控制策略后,易存出现数据安全漏洞。
应用AI技术,智能控制策略推荐结合知识图谱与推荐算法,帮助安全管理人员实现灵活精准管控,当需要需要优化调整某部门的控制策略时,可寻找相似部门的优秀控制策略作为推荐,过滤不相关的系统及控制策略,极大缩小安全管理人员的选择范围,大幅提升控制策略优化调整效率。
在演讲结尾部分,安鹏还跟大家分享了明朝万达用AI技术赋能数据安全治理的成功案例--某省移动警务数据安全治理项目。介绍了该项目的建设背景,业务需求,以及项目中涉及的产品、技术等,其中重点介绍了数据安全治理的应用效果。