乐趣区

关于大数据:阿里巴巴云数据仓库-MaxCompute-数据安全最佳实践

简介:MaxCompute 作为企业级 SaaS 模式云数据仓库,正在为客户业务及其数据提供继续的平安爱护。MaxCompute 近期对产品的平安能力进行了全面降级,联合数据生命周期,针对数据误用、数据滥用、数据泄露、数据失落等典型数据危险场景,构建全生命周期的数据安全防护体系。

本文作者:王璀 / 夏俊伟

简介:MaxCompute 作为企业级 SaaS 模式云数据仓库,正在为客户业务及其数据提供继续的平安爱护。MaxCompute 近期对产品的平安能力进行了全面降级,联合数据生命周期,针对数据误用、数据滥用、数据泄露、数据失落等典型数据危险场景,构建全生命周期的数据安全防护体系。

什么是 MaxCompute?

MaxCompute 是一款云原生、高效能的 SaaS 模式企业级数据仓库服务,被宽泛用于构建现代化企业数据平台,发展 BI 剖析、数据化经营、画像及举荐、智能预测等利用场景。

MaxCompute 构建在阿里云大规模计算、存储资源之上,以 Serverless 架构提供全托管的在线数据仓库服务,打消了传统数据平台在资源扩展性和弹性方面的限度,并最小化用户的运维投入。

MaxCompute 反对多种经典计算模型(批处理、机器学习、交互式剖析等)和欠缺的企业治理性能,借助 MaxCompute,用户可轻松集成和治理企业数据资产,简化数据平台架构,减速价值实现。

MaxCompute 企业级平安能力

· 细粒度受权、

· 数据加密 (BYOK)

· 数据脱敏(数据保护伞)

· 继续备份复原

· 跨地区的容灾备份

· 实时审计日志

MaxCompute 产品集成了泛滥数据安全能力,可分以下三个层面:

根底平安与可信平台,保障数据中心的物理平安与网络安全,次要包含数据中心保障设施、数据中心平安管控、数据中心的网络安全等几个维度的建设。
大数据平台的数据安全,次要从生命周期角度提供分类分级、传输加密、存储加密、备份回复、沙箱隔离、数据脱敏、细粒度权限、客户端限度等子系统,为下层平安利用或工具提供平台能力根底。
数据利用的平安,为用户提供平安核心、数据保护伞、数据地图,优化用户体验,帮忙用户更好应答各类数据危险。

在大数据安全治理中,次要存在以下几点数据安全危险:

  • 数据滥用
  • 数据泄露
  • 数据失落

接下去重点介绍一下用 MaxCompute 的性能解决以上几点数据危险。

如何应答数据滥用

应答数据滥用,最次要的应答是对数据应用做最小化受权,严格限度数据的被拜访、应用的范畴。权限治理的最佳实际:

• 数据分级管理:基于 MaxCompute 的 LabelSecurity 对数据做分类分级管理。
• 受权审批流程:基于 MaxCompute 的 列级别权限管控能力,做最小化受权。
• 定期审计:对权限的申请、审批、应用状况进行剖析,做到事先有审批,预先有审计。
• 及时清理:及时清理过期权限,缩小数据危险。

能够依靠 MaxCompute 的细粒度权限体系,应用 Dataworks 等可视化工具,来实现最小化受权的最佳实际,应答数据滥用的危险,目前公共云上所有用户曾经启用数据访问控制权限零碎。特地是银行等金融行业客户同时还启用了数据标签分类管理策略。

MaxCompute 细粒度权限体系提供精细化的权限治理能力

MaxCompute 反对不同的受权机制来实现对用户或角色的受权,包含:
• 自主访问控制机制 (DAC, Discretionary Access Control): ACL
• 强制访问控制机制 (MAC, Mandatory Access Control):LabelSecurity(标签安全策略)
• 基于角色的访问控制机制 (RBAC, Role based Access Control): 角色治理

如何应答数据泄露

数据泄露可能产生在数据生命周期的不同阶段,如数据传输、数据存储、数据处理、数据交换等阶段。因而,咱们将联合数据生命周期的不同阶段来介绍应答数据泄露的最佳实际。

1,应答数据存储过程中的数据泄露危险 – 应用数据加密(存储加密)性能

MaxCompute 具备存储加密性能,反对用户数据的落盘加密:

• MaxCompute 接入秘钥管理系统 KMS 以保障秘钥的安全性,反对服务秘钥和用户自选秘钥(BYOK)。
• 反对加密算法:AES256,国密算法等。
• . 数据加密后对用户应用放弃通明,各种类型的工作不需额定扭转。

例如某寰球最大多元化娱乐公司,在数据上云就启用了 MaxCompute 的存储加密,以及数据敏感数据主动扫描辨认的功能模块。

2. 应答数据数据处理过程中的数据泄露危险 – MaxCompute 平安隔离能力

在数据处理过程中,应答数据泄露的危险则次要在于大数据平台的平安隔离能力。
MaxCompute 提供独立的隔离环境用于执行数据处理利用,能够反对残缺的 UDF 品种,反对 Java 和 Python UDF, 还反对执行如 Spark、Flink、Tensorflow 等开源三方计算引擎,提供了多元化的数据处理能力。

3. 应答数据交换 (共享) 过程中的数据泄露危险 – MaxCompute 数据隔离与权限体系

在数据交换、或者说数据共享过程中,则须要欠缺的数据隔离能力与权限管理体系来保障数据安全、防备数据泄露危险。MaxCompute 提供不同层级和维度上的数据隔离与权限管理机制,以反对多层次的数据保护和数据共享场景。

  1. 数据生命周期中的敏感数据爱护

应答数据泄露危险中的一个重要主题是敏感数据爱护,前文所述在存储、解决、和替换过程中的危险应答实际,对敏感数据爱护同样实用。此外,还有一些针对敏感数据爱护这一特定场景的最佳实际,特地是金融行业,国内银行,保险,证券基金等公司对数据安全防泄露要求特地高,同时随着法律法规的欠缺,很多互联网公司都在增强对隐衷数据的爱护。

数据脱敏:基于平安行业的脱敏实现或利用,实现不同客户端数据输入时的敏感数据脱敏。脱敏实现也能够与数据分类分级联合应用,对不同分类分级的数据做不同的脱敏实现。例如国内最大主打互联网的保险公司,就是用到了 MaxCompute 的数据脱敏性能来防备他们的数据防泄露。

如何应答数据失落

除了歹意的数据泄露、数据滥用等危险,数据开发过程中的各种误操作,偶发的设施或机房故障,甚或是常见的灾祸意外状况,都能造成数据失落的结果。应答数据失落危险的最佳实际,次要有备份复原,以及容灾能力。

  1. MaxCompute 备份与复原

MaxCompute 具备继续的备份与恢复能力,零碎会主动备份数据的历史版本(例如被删除或批改前的数据)并保留肯定工夫,您能够对保留周期内的数据进行疾速复原,防止因误操作失落数据。

  1. MaxCompute 异地容灾

MaxCompute 的异地容灾能力,更好的提供了在机房故障或意外灾祸等极其场景下的数据安全保障。在为 MaxCompute 我的项目指定备份地位到备份集群后,MaxCompute 主动实现主集群与备份集群的数据复制,达到主集群与被集群数据的统一,实现异地数据容灾。当产生故障,MaxCompute 我的项目从主集群切换到备份集群后,应用备份集群的计算资源拜访备份集群的数据,实现服务的切换和复原。

小结

作为云数据仓库 MaxCompute 具备当先的平安能力,也通过了国内、欧洲、国内的多项平安合规认证,如国内支流认证 ISO 系列、SOC1/2/3、PCI,欧洲支流认证 C5,国内支流认证安全等级爱护 2.0。除了以上几点能够爱护本人的数据安全,同时能够利用 MaxCompute 原生 Information Schema 能力对每个用户的数据处理加工过程进行审计;也能够应用 ActionTrail 的实时事件风险管理平台对每个用户的数据操作进行数据监控告警或者预先审计。

数据安全不仅须要欠缺的工具能力,同时也须要欠缺组织架构来反对,做到数据标注治理,数据应用,数据审计等各个不同部门的人员通力配合,能力杜绝数据安全事件。

原文链接
本文为阿里云原创内容,未经容许不得转载。

退出移动版