CDMP认证是目前全球认可的数据管理方面专业认证证书。它评估个人在数据管理领域的知识和技能,包括数据治理、数据质量、数据架构、数据安全等方面的能力。获得CDMP认证可以证明持证人具备专业的数据管理知识和能力。
中文名 CDMP数据管理专家认证英文名 Certified Data Management Professional英文简称 CDMP颁证机构 DAMA(数据管理国际协会)证书类别 数据管理,数据治理,数据架构同类认证 CDGA 《DAMA数据管理知识体系指南》DAMA的认证有:CDMP数据管理专家认证、CDGA数据治理工程师认证及CDGP数据治理专家认证。
CDMP是DAMA国际组织考试并颁发证书,其有专门的考试网址:http://cdmp.info,考生可随时在此网站注册申请缴费考试(机考),远程摄像头监控。CDMP考试为全英文考试。
CDGA和CDGP是由上海静安国际数据管理协会(DAMA中国)主导并版发证书,考试为中文认证考试。CDGA数据治理工程师(Certified Data Governance Associate,CDGA),CDGP数据治理专家(Certified Data Governance Professional,CDGP)学习的知识体系与CDMP相同,都是基于《DAMA-DMBOK》。
CDGA和CDGP的官方教材可以选用《DAMA-DMBOK》的中文翻译版,即《DAMA数据管理知识体系指南》,它是CDGA/CDGP认证考试的基础。
目前DAMA-DMBOK的_新版是第2版。英文版是《DAMA-DMBOK (2nd Edition): Data Management Body of Knowledge》(2017年出版),中文版是《DAMA数据管理知识体系指南(原书第2版)》(2020年出版)。 DAMA-DMBOK是国际数据管理协会(DAMA)对过去30多年数据管理领域知识和实践的一个总结,由会员们花了多年时间和业界专家反复讨论撰写而成。它是市场上_综合了数据管理方方面面的一部权威性著作,成为数据治理的标准工具书。
《DAMA数据管理知识体系指南(原书第2版)》目录结构中文版序一 中文版序二 原版序 第1章 数据管理 1.1 引言 1.1.1 业务驱动因素 1.1.2 目标 1.2 基本概念 1.2.1 数据 1.2.2 数据和信息 1.2.3 数据是一种组织资产 1.2.4 数据管理原则 1.2.5 数据管理的挑战 1.2.6 数据管理战略 1.3 数据管理框架 1.3.1 战略一致性模型 1.3.2 阿姆斯特丹信息模型 1.3.3 DAMA-DMBOK框架 1.3.4 DMBOK金字塔(Aiken) 1.3.5 DAMA 数据管理框架的进化 1.4 DAMA 和DMBOK 1.5 文献引用与推荐 第2章 数据处理伦理 2.1 引言 2.2 业务驱动因素 2.3 基本概念 2.3.1 数据伦理准则 2.3.2 数据隐私法背后的原则 2.3.3 在线数据的伦理环境 2.3.4 违背伦理进行数据处理的风险 2.3.5 建立数据伦理文化 2.3.6 数据伦理和治理 2.4 文献引用与推荐 第3章 数据治理 3.1 引言 3.1.1 业务驱动因素 3.1.2 目标和原则 3.1.3 基本概念 3.2 活动 3.2.1 规划组织的数据治理 3.2.2 制定数据治理战略 3.2.3 实施数据治理 3.2.4 嵌入数据治理 3.3 工具和方法 3.3.1 线上应用/网站 3.3.2 业务术语表 3.3.3 工作流工具 3.3.4 文档管理工具 3.3.5 数据治理记分卡 3.4 实施指南 3.4.1 组织和文化 3.4.2 调整与沟通 3.5 度量指标 3.6 文献引用与推荐 第4章 数据架构 4.1 引言 4.1.1 业务驱动因素 4.1.2 数据架构成果和实施 4.1.3 基本概念 4.2 活动 4.2.1 建立企业数据架构 4.2.2 整合其他企业架构 4.3 工具 4.3.1 数据建模工具 4.3.2 资产管理软件 4.3.3 图形设计应用 4.4 方法 4.4.1 生命周期预测 4.4.2 图标使用规范 4.5 实施指南 4.5.1 就绪评估和风险评估 4.5.2 组织和文化 4.6 数据架构治理 4.6.1 数据架构治理活动 4.6.2 度量指标 4.7 文献引用与推荐 第5章数据建模和设计 5.1 引言 5.1.1 业务驱动因素 5.1.2 目标和原则 5.1.3 基本概念 5.2 活动 5.2.1 规划数据建模 5.2.2 建立数据模型 5.2.3 审核数据模型 5.2.4 维护数据模型 5.3 工具 5.3.1 数据建模工具 5.3.2 数据血缘工具 5.3.3 数据分析工具 5.3.4 元数据资料库 5.3.5 数据模型模式 5.3.6 行业数据模型 5.4 方法 5.4.1 命名约定的_佳实践 5.4.2 数据库设计中的_佳实践 5.5 数据建模和设计治理 5.5.1 数据建模和设计质量管理 5.5.2 度量指标 5.6 文献引用与推荐 第6章 数据存储和操作 6.1 引言 6.1.1 业务驱动因素 6.1.2 目标和原则 6.1.3 基本概念 6.2 活动 6.2.1 管理数据库技术 6.2.2 管理数据库操作 6.3 工具 6.3.1 数据建模工具 6.3.2 数据库监控工具 6.3.3 数据库管理工具 6.3.4 开发支持工具 6.4 方法 6.4.1 在低阶环境中测试 6.4.2 物理命名标准 6.4.3 所有变更操作脚本化 6.5 实施指南 6.5.1 就绪评估/风险评估 6.5.2 组织和文化变化 6.6 数据存储和操作治理 6.6.1 度量指标 6.6.2 信息资产跟踪 6.6.3 数据审计与数据有效性 6.7 文献引用与推荐 第7章 数据安全 7.1 引言 7.1.1 业务驱动因素 7.1.2 目标和原则 7.1.3 基本概念 7.2 活动 7.2.2 制定数据安全制度 7.2.3 定义数据安全细则 7.2.4 评估当前安全风险 7.2.5 实施控制和规程 7.3 工具 7.3.1 杀毒软件/安全软件 7.3.2 HTTPS 7.3.3 身份管理技术 7.3.4 入侵侦测和入侵防御软件 7.3.5 防火墙(防御) 7.3.6 元数据跟踪 7.3.7 数据脱敏/加密 7.4 方法 7.4.1 应用CRUD矩阵 7.4.2 即时安全补丁部署 7.4.3 元数据中的数据安全属性 7.4.4 项目需求中的安全要求 7.4.5 加密数据的高效搜索 7.4.6 文件清理 7.5 实施指南 7.5.1 就绪评估/风险评估 7.5.2 组织与文化变革 7.5.3 用户数据授权的可见性 7.5.4 外包世界中的数据安全 7.5.5 云环境中的数据安全 7.6 数据安全治理 7.6.1 数据安全和企业架构 7.6.2 度量指标 7.7 文献引用与推荐 第8章 数据集成和互操作 8.1 引言 8.1.1 业务驱动因素 8.1.2 目标和原则 8.1.3 基本概念 8.2 活动 8.2.1 规划和分析 8.2.2 设计数据集成解决方案 8.2.3 开发数据集成解决方案 8.2.4 实施和监测 8.3 工具 8.3.1 数据转换引擎/ETL工具 8.3.2 数据虚拟化服务器 8.3.3 企业服务总线 8.3.4 业务规则引擎 8.3.5 数据和流程建模工具 8.3.6 数据剖析工具 8.3.7 元数据存储库 8.4 方法 8.5 实施指南 8.5.1 就绪评估/风险评估 8.5.2 组织和文化变革 8.6 数据集成和互操作治理 8.6.1 数据共享协议 8.6.2 数据集成和互操作与数据血缘 8.6.3 度量指标 8.7 文献引用与推荐 第9章 文件和内容管理 9.1 引言 9.1.1 业务驱动因素 9.1.2 目标和原则 9.1.3 基本概念 9.2 活动 9.2.1 规划生命周期的管理 9.2.2 创建内容处理制度 9.2.3 定义内容信息架构 9.2.4 实施的生命周期管理 9.2.5 发布和分发内容 9.3 工具 9.3.1 企业内容管理系统 9.3.2 协作工具 9.3.3 受控词汇表和元数据工具 9.3.4 标准标记和交换格式 9.3.5 电子取证技术 9.4 方法 9.4.1 诉讼应诉手册 9.4.2 诉讼应诉数据映射 9.5 实施指南 9.5.1 就绪评估/风险评估 9.5.2 组织和文化变革 9.6 文件和内容治理 9.6.1 信息治理架构 9.6.2 信息的激增 9.6.3 管理高质量的内容 9.6.4 度量指标 9.7 文献引用与推荐 第10章 参考数据和主数据 10.1 引言 10.1.1 业务驱动因素 10.1.2 目标和原则 10.1.3 基本概念 10.2 活动 10.2.1 主数据管理活动 10.2.2 参考数据管理活动 10.3 工具和方法 10.4 实施指南 10.4.1 遵循主数据架构 10.4.2 监测数据流动 10.4.3 管理参考数据变更 10.4.4 数据共享协议 10.4.5 组织和文化变革 10.5 参考数据和主数据治理 10.5.1 治理过程决定事项 10.5.2 度量指标 10.6 文献引用与推荐 第11章 数据仓库和商务智能 11.1 引言 11.1.1 业务驱动因素 11.1.2 目标和原则 11.1.3 基本概念 11.2 活动 11.2.1 理解需求 11.2.2 定义和维护数据仓库/商务智能架构 11.2.3 开发数据仓库和数据集市 11.2.4 加载数据仓库 11.2.5 实施商务智能产品组合 11.2.6 维护数据产品 11.3 工具 11.3.1 元数据存储库 11.3.2 数据集成工具 11.3.3 商务智能工具的类型 11.4 方法 11.4.1 驱动需求的原型 11.4.2 自助式商务智能 11.4.3 可查询的审计数据 11.5 实施指南 11.5.1 就绪评估/风险评估 11.5.2 版本路线图 11.5.3 配置管理 11.5.4 组织与文化变革 11.6 数据仓库/商务智能治理 11.6.1 业务接受度 11.6.2 客户/用户满意度 11.6.3 服务水平协议 11.6.4 报表策略 11.6.5 度量指标 11.7 文献引用与推荐 第12章 元数据管理 12.1 引言 12.1.1 业务驱动因素 12.1.2 目标和原则 12.1.3 基本概念 12.2 活动 12.2.1 定义元数据战略 12.2.2 理解元数据需求 12.2.3 定义元数据架构 12.2.4 创建和维护元数据 12.2.5 查询、报告和分析元数据 12.3 工具 12.4 方法 12.4.1 数据血缘和影响分析 12.4.2 应用于大数据采集的元数据 12.5 实施指南 12.5.1 就绪评估/风险评估 12.5.2 组织和文化变革 12.6 元数据治理 12.6.1 过程控制 12.6.2 元数据解决方案的文档 12.6.3 元数据标准和指南 12.6.4 度量指标 12.7 文献引用与推荐 第13章 数据质量 13.1 引言 13.1.1 业务驱动因素 13.1.2 目标和原则 13.1.3 基本概念 13.2 活动 13.2.1 定义高质量数据 13.2.2 定义数据质量战略 13.2.4 执行初始数据质量评估 13.2.6 定义数据质量改进目标 13.2.7 开发和部署数据质量操作 13.3 工具 13.3.1 数据剖析工具 13.3.2 数据查询工具 13.3.3 建模和ETL工具 13.3.4 数据质量规则模板 13.3.5 元数据存储库 13.4 方法 13.4.1 预防措施 13.4.2 纠正措施 13.4.3 质量检查和审核代码模块 13.4.4 有效的数据质量指标 13.4.5 统计过程控制 13.4.6 根本原因分析 13.5 实施指南 13.5.1 就绪评估/风险评估 13.5.2 组织与文化变革 13.6 数据质量和数据治理 13.6.1 数据质量制度 13.6.2 度量指标 13.7 文献引用与推荐 第14章 大数据和数据科学 14.1 引言 14.1.1 业务驱动 14.1.2 原则 14.1.3 基本理念 14.2 活动 14.2.1 定义大数据战略和业务需求 14.2.2 选择数据源 14.2.3 获得和接收数据源 14.2.4 制定数据假设和方法 14.2.5 集成和调整数据进行分析 14.2.6 使用模型探索数据 14.2.7 部署和监控 14.3 工具 14.3.1 MPP 无共享技术和架构 14.3.2 基于分布式文件的数据库 14.3.3 数据库内算法 14.3.4 大数据云解决方案 14.3.5 统计计算和图形语言 14.3.6 数据可视化工具集 14.4 方法 14.4.1 解析建模 14.4.2 大数据建模 14.5 实施指南 14.5.1 战略一致性 14.5.2 就绪评估/风险评估 14.5.3 组织与文化变迁 14.6 大数据和数据科学治理 14.6.1 可视化渠道管理 14.6.2 数据科学和可视化标准 14.6.3 数据安全 14.6.4 元数据 14.6.5 数据质量 14.6.6 度量指标 14.7 文献引用与推荐 第15章 数据管理成熟度评估 15.1 引言 15.1.1 业务驱动因素 15.1.2 目标和原则 15.1.3 基本概念 15.2 活动 15.2.1 规划评估活动 15.2.2 执行成熟度评估 15.2.3 解释结果及建议 15.2.4 制订有针对性的改进计划 15.2.5 重新评估成熟度 15.3 工具 15.4 方法 15.4.1 选择DMM 框架 15.4.2 DAMA-DMBOK框架使用 15.5 实施指南 15.5.1 就绪评估/风险评估 15.5.2 组织和文化变革 15.6 成熟度管理治理 15.6.1 DMMA 过程监督 15.6.2 度量指标 15.7 文献引用与推荐 第16章 数据管理组织与角色期望 16.1 引言 16.2 了解现有的组织和文化规范 16.3 数据管理组织的结构 16.3.1 分散运营模式 16.3.2 网络运营模式 16.3.3 集中运营模式 16.3.4 混合运营模式 16.3.5 联邦运营模式 16.3.6 确定组织的_佳模式 16.3.7 DMO 替代方案和设计考虑因素 16.4 关键成功因素 16.4.1 高管层的支持 16.4.2 明确的愿景 16.4.3 积极的变更管理 16.4.4 _之间的共识 16.4.5 持续的沟通 16.4.6 利益相关方的参与 16.4.7 指导和培训 16.4.8 采用度量策略 16.4.9 坚持指导原则 16.4.10 演进而非革命 16.5 建立数据管理组织 16.5.4 让利益相关方参与进来 16.6 数据管理组织与其他数据相关机构之间的沟通 16.6.1 首席数据官 16.6.2 数据治理 16.6.3 数据质量 16.6.4 企业架构 16.6.5 管理全球化组织 16.7 数据管理角色 16.7.1 组织角色 16.7.2 个人角色 16.8 文献引用与推荐 第17章 数据管理和组织变革管理 17.1 引言 17.2 变革法则 17.3 并非管理变革: 而是管理转型过程 17.4 科特的变革管理八大误区 17.4.1 误区一: 过于自满 17.4.2 误区二: 未能建立足够强大的指导联盟 17.4.3 误区三: 低估愿景的力量 17.4.4 误区四: 10 倍、100 倍或1000 倍地放大愿景 17.4.5 误区五: 允许阻挡愿景的障碍存在 17.4.6 误区六: 未能创造短期收益 17.4.7 误区七: 过早宣布胜利 17.4.8 误区八: 忽视将变革融入企业文化 17.5 科特的重大变革八步法 17.5.1 树立紧迫感 17.5.2 指导联盟 17.5.3 发展愿景和战略 17.5.4 沟通传达变革愿景 17.6 变革的秘诀 17.7 创新扩散和持续变革 17.7.1 随着创新扩散而需克服的挑战 17.7.2 创新扩散的关键要素 17.7.3 创新采纳的五个阶段 17.7.4 接受或拒绝创新变革的影响因素 17.8 持续变革 17.8.1 紧迫感/不满意感 17.8.2 构建愿景 17.8.3 指导联盟 17.8.4 相对优势和可观测性 17.9 数据管理价值的沟通 17.9.1 沟通原则 17.9.2 受众评估与准备 17.9.3 人的因素 17.9.4 沟通计划 17.9.5 保持沟通 17.10 文献引用与推荐 致谢 附录 附录A 主要贡献者 附录B 审阅和评论者
DAMA知识体系介绍DAMA-DMBOK2理论框架由DAMA车轮图(11个职能领域)和DAMA环境因素六边形图(7个基本环境要素) 共同构成“DAMA数据管理知识体系”。
每项数据职能领域都在7个基本环境要素约束下开展工作,按照一定的逻辑结构进行分析,_数据治理的目标和实际商业过程的贡献。用于指导组织的数据管理职能和数据战略的评估工作,并建议和指导刚起步的组织去实施和提升数据管理。如下的矩阵以图示方式给出此框架(DAMA职能框架):
11个职能域数据治理 :通过建立一个能够满足企业数据需求的决策体系,为数据管理提供指导和监督。
数据架构 :定义了与组织战略协调的管理数据资产蓝图,以建立战略性数据需求及满足需求的总体设计。
数据建模和设计 :以数据模型的精确形式,进行发现、分析、展示和沟通数据需求的过程。
数据存储和操作 :以数据价值_大化为目标,在整个数据生命周期中,从计划到销毁的各种操作活动。
数据安全 :确保数据隐私和机密性得到维护,数据不被破坏,数据被适当访问。
数据集成和互操作 :包括与数据存储、应用程序和组织之间的数据移动和整合相关的过程。
文档和内容管理 :用于管理非结构化媒体数据和信息的生命周期过程,包括计划、实施和控制活动,尤其是指支持法律法规遵从性要求所需的文档。
参考数据和主数据 :包括核心共享数据的持续协调和维护,使关键业务实体的真实信息,以准确、及时和相关联的方式在各系统间得到一致使用。
数据仓库和商务智能 :包括计划、实施和控制流程来管理决策支持数据,并使知识工作者通过分析报告从数据中获得价值。
元数据 :包括规划、实施和控制活动,以便能够访问高质量的集成元数据,包括定义、模型、数据流和其他至关重要的信息(对理解数据及其创建、维护和访问系统有帮助)。
数据质量 :包括规划和实施质量管理技术,以测量、评估和提高数据在组织内的适用性。
基本环境要素目标与原则 :每个职能在自己主题领域里的方向性目标,以及职能指标量化的基本原则。
活动 :每个职能都是由一个或多个活动组成,其中有部分活动能被细化为子活动。
主要交付物 :信息、物理数据库即各职能在管理过程中_终输出的文档。
角色与职责 :参与执行和监督职能的业务角色和IT角色,以及其各自职能中承担的具体责任。
实践与方法 :包含了常见和流行的实践方法,以及交付物的执行过程和步骤。
技术 :各种配套支撑技术的类别、标准和规范、产品选择的标准和常见的学习曲线。
组织与文化 :主要包括管理度量指标和标准、成功和商业价值的度量指标和标准等因素。
核心章节及内容介绍全书共17章。核心章节及有关内容,如下:
◆ 数据治理:
通过建立一个能够满足企业需求的数据决策体系,为数据管理提供指导和监督。这些权限和责任的建立应该考虑到组织的整体需求。(参见第3章)
◆ 数据架构:
定义了与组织战略协调的管理数据资产的“蓝图”,指导基于组织的战略目标,指定符合战略需求的数据架构。(参见第4章)
◆ 数据建模和设计:
以数据模型(data model.)的精确形式,进行发现、分析、 展示和沟通数据需求的过程。(参见第5章)
◆ 数据存储和操作:
以数据价值_大化为目标,包括存储数据的设计、实现和支持活动,以及在整个数据生命周期中,从计划到销毁的各种操作活动。(参见第6章)
◆ 数据安全:
这一活动确保数据隐私和安全,数据的获得和使用必须要有安全的_。(参见第7章)
◆ 数据集成和互操作:
包括与数据存储、应用程序和组织之间的数据移动和整合相关的过程。(参见第8章)
◆ 文档和内容管理:
用于管理非结构化媒体的数据和信息的生命周期过程,包括计划、实施和控制活动,尤其是指支持法律法规遵从性要求所需的文档。(参见第9章)
◆ 参考数据和主数据管理:
包括核心共享数据的持续协调和维护,使关键业务实体的真实信息,以准确、及时和相关联的方式在各系统间得到一致使用。(参见第10章)
◆ 数据仓库和商务智能:
包括计划、实施和控制流程,来管理 决策支持数据,并使知识工作者通过分析报告从数据中获得价值。(参见第11章)
◆ 元数据管理:
包括规划、实施和控制活动,以便能够访问高质量的集成元数据, 包括定义、模型、数据流和其他至关重要的信息(对理解数据及其创建、维护和访问系统有帮助)。(参见第12章)
◆ 数据质量管理:
包括规划和实施质量管理技术,以测量、评估和提高数据在组 织内的适用性。(参见第13章)
除了有关知识领域的章节外,还包含以下主题章节:
数据处理伦理(Data Handling Ethics):描述了关于数据及其应用过程中,数据伦理规范在促进信息透明、社会责任决策中的核心作用。数据采集、分析和使用过程中的伦理意识对所有数据管理专业人士有指导作用。(参见第2章)
大数据和数据科学(Big Data and Data Science):描述了针对大型的、多样化数据集收集和分析能力的提高而出现的技术和业务流程。(参见第14章)
数据管理成熟度评估(Data Management Maturity Assessment):概述了评估和改进组织数据管理能力的方法。(参见第15章)
数据管理组织和角色期望(Data Management Organization and Role Expectations):为组建数据管理团队、实现成功的数据管理活动提供了实践提供和参考因素。(第16章)
数据管理和组织变革管理(Data Management and Organizational Change Management ):描述了如何计划和成功地推动企业文化变革,文化的变革是将数据管理实践有效地嵌入组织中必然结果。(第17章)
部分核心知识点内容1、数据管理主要内容
(1)数据管理九大核心原则
图. 数据管理九大核心原则
数据是有独立属性的资产:数据是一种资产,但相比其他资产,其在管理方式的某些方面有很大差异。对比金融和实物资产,其中_明显的一个特点是数据资产在使用过程中不会产生消耗。
数据价值能够并且应该通过经济术语来表达:将数据称为资产意味着它有价值。虽然有技术手段可以测量数据的数量和质量,但还未形成这样做的标准来衡量其价值。想要对其数据做出更好决策的组织应该开发一致的方法来量化该价值。他们还应该衡量低质量数据的成本和高质量数据的好处。
管理数据意味着管理数据的质量:确保数据符合应用的要求是数据管理的首要目标。为了管理质量,组织必须确保他们了解利益相关者对质量的要求,并根据这些要求度量数据。
管理数据需要元数据:管理任何资产都需要首先拥有该项资产的数据(员工人数,账户号码等)。用于管理和如何使用的数据都叫元数据。因为数据无法拿在手中或触摸到,要理解它是什么以及如何使用它,需要以元数据的形式定义这些知识。元数据源于与数据创建、处理和使用相关的一系列流程,包括架构、建模、管理、治理、数据质量管理、系统开发、IT和业务运营以及分析。
管理数据需要计划:即便是小型组织也可能有复杂的技术和业务流程蓝图。数据在多个地方被创建,且因为使用需要在很多存储位置间移动。需要一些协调工作来保持_终结果的一致,需要从架构和流程的角度进行规划。
管理数据是跨职能的工作:它需要一系列的技能和专业知识,因此单个团队无法管理组织的所有数据。数据管理需要技术能力、非技术技能以及协作能力。
数据管理需要企业级视角:虽然数据管理存在很多本地应用程序,但它必须能够有效地被应用于整个企业。
数据是流动的,数据管理必须不断发展演进,以跟上数据创建的方式、应用的方式和消费者的变化。
数据管理是全生命周期的管理:数据是有生命周期的,因此数据管理需要管理它的生命周期。因为数据又将产生更多的数据,所以数据生命周期本身可能非常复杂。数据管理实践活动需要考虑数据的整个生命周期。
(2)知识领域语境关系图
图. 知识领域语境关系图
描述了知识领域的细节,包括与人员、流程和技术相关的细节。它们基于产品管理(供应者、输入、活动、交付成果和消费者)的SIPOC图的概念。
语境关系图将活动放在中心,这些活动生产了满足利益相关者需求的可交付成果。每个语境关系图都以知识领域的定义和目标开始。
驱动目标(中心)的活动分为四个阶段:计划(P)、开发(D)、操作(O)和控制(C)。
在左侧流入活动中是输入和供应商。右侧从活动中流出是交付成果和消费者。参与者列在活动下方。
底层是影响知识领域各个方面的工具、技术和度量标准。
(3)DAMA金字塔
图.DAMA金字塔图
第1阶段:组织购买包含数据库功能的应用程序。这意味着组织以此作为数据建模、设计、数据存储和数据安全的起点。要使系统在其数据环境中运行,还需要做数据集成和交互操作方面的工作。
第2阶段:一旦他们开始使用应用程序,他们将发现数据质量方面的挑战。但获得更高质量的数据取决于可靠的元数据和一致的数据架构。它们说明了来自不同系统的数据是如何协同工作的。
第3阶段:管理数据质量、元数据和架构需要严格地实践数据治理,为数据管理活动提供体系性支持。数据治理还支持战略计划的实施,如文档和内容管理、参考数据管理、主数据管理、数据仓库和商务智能,这些黄金金字塔中的高级应用都会得到充分地支持。
第4阶段:该组织充分利用了良好管理数据的好处,并提高了其分析能力。
2、数据处理伦理
(1)数据处理伦理语境关系图
描述构成数据管理伦理的基本原则;阐述数据伦理处理方法如何帮助组织避免数据的非正常使用及由此带来的对客户、声誉或更广大群体的危害。
图. 数据处理伦理语境关系图
(2)数据伦理准则
尊重他人: 这个准则反映了对待人类_基本的伦理要求,即尊重个人尊严和自主权。
行善原则:这条准则有两个要素:_,不伤害;第二,将利益_大化、伤害_小化。
公正:这一准则认为待人公平和公正
(3)建立合乎伦理道德的数据处理文化
建立合乎伦理道德的数据处理文化需要理解现有实践,定义预期行为,将它们编入策略和道德规范,并提供培训和进行监督,以强制执行预期行为,与管理数据和改变文化相关的其他举措一样,这一过程需要强有力的领导层的推动。
合乎伦理道德的数据处理显然包括遵守法律。它也会影响组织内部和外部对数据的分析、 解释和利用方式,重视伦理道德行为的组织文化不仅 要有行为准则,还要确保有清晰的沟通和治理机制,以支持那些意识到不道德行为或风险的员工。
图. 伦理风险模型
(4)主要观点
组织需要以合乎伦理道德的方式处理数据,否则就有风险,就有可能失去客户、员工、合作伙伴和其他利益相关方的信任;
数据伦理植根于社会的基本原则和伦理道德的基本述求;
与数据相关的监管基于这些相同的原则和要求,但监管不能涵盖所有意外情况。因此,组织必须考虑到自己行为的伦理道德规范;
组织应该为它们处理数据培养道德责任文化,这不仅是为了符合合规要求,同时也是本来就应该做的正确的事;
合乎伦理道德的数据处理_终将为组织提供竞争优势,因为它是信任的基础。
3、数据建模和设计
(1)数据建模与设计语境关系图
数据建模与设计:数据建模是发现、分析和确定数据需求的过程,然后用一种用称为数据模型的精确形式表示和传递这些数据需求。这个过程是循环迭代的,可能包括概念、逻辑和物理模型。
图. 数据建模与设计语境关系图
4、数据集成和互操作
定义:管理和整合在应用系统和组织内部,或者应用系统与组织之间传输的数据。
图. 数据集成和互操作语境关系图
5、大数据和数据科学
大数据不仅是指数据量大,也包括数据的种类(结构化的和非结构化的,文档(documnents)、文件(files)、音频、视频、流数据等), 以及数据产生的速度。那些从数据中探究并研发预测模型、机器学习模型、规范性模型和分析方法、并将研发结果部署供相关方进行分析的人,被称为数据科学家。
大数据和数据科学:多种不同类型的数据集合(大数据)和分析(数据科学,解析,可视化),都是为了洞察和解决分析初始时未知的问题。
图. 大数据和数据科学语境关系图
随着大数据被加载到数据仓库和商务智能环境中,数据科学技术被用来为组织提供前瞻性的视图(“挡风玻璃”)。使用不同种类的数据源,实现预测能力、基于模型的实时分析能力,能够为组织未来的发展方向提供更深刻的洞察能力。
图. 收敛信息三角型
要想利用大数据,就需要改变数据的管理方式。大多数数据仓库都基于关系模型,而大数据一般不采用关系模型组织数据。大多数数据仓库依赖于ETL(提取、转换和加载)的概念。大数据解决方案,如数据湖,则依赖于ELT的概念——先加载后转换。更加重要的是,数据的生产速度和容量带来了挑战,需要在数据管理的各个关键领域中采用不同的方法,如集成、元数据管理和数据质量评估。
图 DW/BI概念和大数据架构
6、数据管理成熟度评估
成熟度模型通过描述各阶段能力特点来定义成熟度的级别。当一个组织满足某阶段能力特征时,就可以评估其成熟度等级,并制定一个提高能力的计划。它还可以帮助组织在等级评估的指导下进行改进,与竞争对手或合作伙伴进行比较。在每一个新等级,能力评估会变得更加一致、可预测和可靠。当能力呈现出与等级不符的特征时,等级会得到提升。但能力水平有既定顺序,不能跳过任何等级。
图. 数据管理成熟度评估语境关系图
CMM通常定义5~6个成熟度级别,每个级别有各自的特性,从初始级到优化级。数据管理成熟度评估框架被划分为离散的数据管理主题,框架焦点和内容取决于它们是用于通用行业还是特定行业。
图. 数据管理成熟度模型示例
7、数据管理组织和角色期望
大多数组织正面临着越来越多的数据。这些数据格式多样化、数量庞大,并来源于不同的渠道。由于数据的数量和种类的增加,加剧了数据管理的复杂性。与此同时,数据消费者要求更快速、更方便地访问数据,他们希望理解并使用数据,以便及时地解决关键业务问题。数据管理和数据治理组织需要足够灵活,才能在不断发展的环境中有效地工作。因此,需要澄清关于所有权、协作、责任和决策的基本问题。
本章将描述在组建数据管理或数据治理组织时,应该考虑的一组原则。它同时涉及数据治理和数据管理,因为数据治理为数据管理组织执行活动提供指导和业务背景。两者都没有完美的组织结构。虽然数据治理和数据管理组织应该遵循一些公共原则,但是很多细节依赖于组织所在行业的驱动因素和组织自身的企业文化。
图. 评估数据管理组织运营模式
运营模式是改进数据管理和数据治理实践的起点。引入运营模式之前,需要了解它如何影响当前组织以及它可能会如何发展。由于运营模式将帮助政策和流程的定义、批准和执行,因此确定_适合组织的运营模式是至关重要的。
评估当前的组织结构是集中的、分散的,还是混合的、层级化的或相对扁平的?描述相关部门或区域的独立性。他们的运作几乎是自给自足的?他们的要求和目标是否有很大的差异?_重要的是,尝试确定决策是如何做出的(例如,民主或强制性指令),以及如何实施这些决策?
8、数据管理和组织变革管理
成功的数据管理实践需要:
根据信息价值链调整数据责任制度,以此来学习横向管理。
将垂直的(筒仓)数据责任制度转变为共享的信息管理工作。
将局部业务关注点或IT部门工作中的信息质量演变为整个组织的核心价值。
将对信息质量的思考从"数据清洗与数据质量记分卡”提升转变为组织的基本能力。
对不良数据管理引发的代价和规范化数据管理带来的价值进行衡量。
组织变革管理专家约翰·科特(John P. Kotter)总结了一套基本的“变革法则”,这些法则描述了为什么变革并不容易。在变革过程之初就认识到这些问题有助于取得成功。
组织不变革,人就变: 不是因为新组织宣布成立或新系统实施上线就要变革。人们认识到变革带来的价值而发生行为变化时,变革就会发生。改进数据管理实践和实施正式数据治理流程将对组织产生深远的影响。
人们需要改变数据处理的方式,以及在数据相关活动中的互动方式。
人们不会抗拒变革,但抵制被改变:人们无法接受看起来武断或独裁的变革。如果他们始终参与变革、定义变革,并且他们理解推动变革愿景,以及知道变革发生的时间和方式,他们就更有可能愿意进行变革。
数据相关举措的变革管理部分涉及到团队合作,以在组织层面建立起对数据管理实践改进后价值的理解。
事情之所以存在是惯性所致:事情的现状可能是因为好的历史原因。在过去某个节点,有人定义了业务需求、定义了流程、设计了系统、编写了策略、或者确立了当前恰好需要变革的商业模式。了解当前数据管理实践的起源,将有助于组织规避历史错误。
除非有人推动变革,否则很可能止步不前:如果想有所改进,就必须采取新措施。
如果不考虑人的因素,变革将很容易: 变革在"技术"层面上的实现通常是很容易的。挑战来自于如何处理人与人之间的自然差异。
CDMP在线题库·免费刷·免费学
章节练习 教材顺序 章章练习 夯实基础 高频考点 重点难点 高效学习 背诵记忆 仿真模考 全真模拟 综合模拟 巩固知识 免费试听 精选课件 跟着老师一起学 错题本 查漏补缺 反复学 反复练 微信扫码进入小程序