上两篇“数据安全出境系列”文章中,我们介绍了《数据安全出境系列——数据安全控制能力》《数据安全出境系列——数据识别能力》。今天我们继续介绍第三个能力:对使用、存储、流转、分享中不合规数据的阻断能力。   

在数据出境情境中,哪些数据是需要被严格管控的呢?

至少包含以下几种: 涉密数据、 征信数据、 国家核心数据、 地图数据、 重要数据、 网约车业务相关数据和信息、 人口健康数据、 健康医疗大数据、 人类遗传资源信息、 个人金融信息。
 

要对某一类型数据做阻断,我们首先需要对数据的类型进行识别。为了便于理解,我们以涉密数据来举例说明。

  • 哪些数据属于涉密数据?

  • 满足什么样条件的数据会被认定为涉密数据?

  • 涉密数据“长”什么样子?

单一的识别技术和策略对以上的问题是无法判断的,需要通过涉密数据模型来识别。比如:一个人的身份证号出现时,无法认定为涉密数据,需要结合上下文内容进行分析;或者单一数据不能被定义为涉密数据,多份同类数据结合起来,就可能被认定为涉密数据。我们要通过关键字识别、字典权重识别、正则表达式识别、文件属性识别、图像内容识别、自然语言分析处理、标签识别、机器学习识别和指纹识别等多种技术,提炼出涉密类型数据的共同点,并将这些共同点按照算法生成类别特征,用于后续对检测到的数据进行识别。


当数据向境外传输时,我们的系统识别到传输的数据中某个文档的特征与涉密数据模型相似度达到设定的阈值,比如相似度在90%,系统会认为这是一个涉密数据,会对数据的传输进行阻断。一旦系统判断为某个文档为涉密数据,这个文档在任何一个地方出现都会被认定为是涉密数据,无论是在终端、网络、应用还是云端。


有些情况下我们判断某个文档是否为涉密文档,需要将多个检测策略规则进行搭配,支持基于“与”、“或”、“非”这三种判断的各种组合关系,减少系统误报的机率。

有些人员为了逃避检测,可能会对涉密文档进行压缩、嵌套、加密等,但是无论数据如何变形,只要是涉密数据,都可以被检测到并及时阻断

内部数据泄露行为阻断

天空卫士的数据安全出境方案是一套将行为分析技术与数据保护体系相结合的主动、持续、自适应的防御体系。在实现数据安全保护功能的基础上,能够根据用户的操作行为,实现用户行为的可视化,判断每个用户的风险等级并快速定位风险用户和高危威胁事件,预测可能会发生的威胁风险事件,防患于未然,从而实现智能化、自动化、高效率的主动防御

外部攻击行为阻断

天空卫士的数据安全出境方案能通过分析用户的"非正常"数据操作行为来锁定内部的潜在威胁,实现对内部异常用户行为的主动防御。同时,通过系统预置的攻击或异常向量匹配,精确解析出某些已被木马病毒控制的实体,完成潜在内部威胁的可视化,并预警和解决由此而导致的数据泄露风险。

下一期的“数据安全出境系列”里,我们将会讲到天空卫士数据出境方案的第四个能力,数据安全审计能力,感谢大家对我们的关注。