第一部分开篇
第1章大数据治理概述
第2章大数据治理的框架
21大数据类型
22信息治理准则
23大数据治理的产业和功能场景
第3章成熟度评估
31IBM信息治理委员会的成熟度模型
32评估成熟度的示例问题
第4章业务案例
41通过大数据治理,提高运营实时性和旅客安全度
42量化大数据治理对客户隐私的财务影响
43通过治理大数据生命周期,降低IT成本
44评估数据质量和主数据对大数据计划的影响
45计算大数据质量的价值
第5章路线图
51路线图案例研究
第二部分大数据治理准则
第6章大数据治理的组织
61绘制关键流程图并建立职责分配模型,以识别大数据
治理中的利益攸关者
62确定新角色和既有角色的适当组合
63酌情任命大数据主管
64在传统信息治理角色的基础上,酌情增加大数据
责任
65建立承担包括大数据在内的责任混合式信息治理
组织
第7章元数据
71创建一个体现关键大数据术语的业务定义的词库
72理解对Apache Hadoop中元数据的持续支持
73对业务词库中的敏感大数据进行标记
74从相关的大数据存储中输入技术元数据
75将相关的数据源与业务词库中的术语进行链接
76使用运营元数据监测大数据的流动
77保留技术元数据,以支持数据血统和影响分析
78从非结构化文件中采集元数据,支持企业搜索
79扩展既有的元数据角色,将大数据纳入其中
第8章大数据隐私
81识别敏感的大数据
82对元数据库中的敏感大数据进行标记
83应对国家、州(省)层面的隐私立法和隐私限制
84管理个人数据跨国界流动的情况
85监控特权用户对敏感大数据的访问
第9章大数据质量
91与商业上的利益攸关者协作,建立并测度大数据质量的
置信区间
92利用准结构化和非结构化数据,提高人口稀疏的结构化
数据的质量
93使用流数据分析技术解决内存中的数据质量问题,无须
将中间结果输入硬盘
94任命对信息治理委员会负责的数据主管,由其负责提高
测度的质量
第10章业务流程整合
101识别将会受到大数据治理影响的关键流程
102建立关键活动的流程图
103针对业务流程中的关键步骤,制定大数据治理政策
第11章主数据整合
111提高主数据的质量,以支持大数据分析
112利用大数据提高主数据的质量
113提高关键参考数据的质量和一致性,以支持大数据
治理计划
114审视社交媒体平台政策,以确定与主数据管理整合
的程度
115从非结构化文本中挖掘有用信息,以丰富主数据
第12章管理大数据的生命周期
121基于规制和业务要求,扩展保留时间表,将大数据包含
其中
122提供法律保留区,并支持电子证据展示(eDiscovery)
123压缩大数据并将其存档,降低IT成本,提高应用
绩效
124管理实时流数据的生命周期
125保留社交媒体记录,以符合规制要求,并支持电子
证据展示
126基于规制和业务要求,正当合理地处置不再需要的
大数据
第三部分大数据的类型
第13章Web和社交媒体数据
131在制定有关客户社交媒体数据的可接受使用的政策时,
考虑不断变化的规制和习俗
132制定有关雇员和求职者社交媒体数据的可接受使用
的政策
133利用置信区间评估社交媒体数据的质量
134制定有关Cookies与其他Web跟踪装置的可接受使用
的政策
135在不侵犯隐私并遵从规制要求的基础上,定义连接在线
和离线数据的政策
136确保网络统计数据的一致性
第14章机器对机器的数据
141评估目前可用的地理位置数据
142制定关于客户地理位置数据的可接受使用的政策
143制定关于雇员地理位置数据的可接受使用的政策
144保证RFID数据的隐私安全
145制定与其他类型M2M数据的隐私相关的政策
146处理元数据和M2M数据的质量问题
147制定与M2M数据的保留期有关的政策
148提高主数据的质量,以支持M2M计划
149确保SCADA设施免遭网络攻击
第15章大体量交易数据
第16章生物计量学数据
161评估与生物计量学数据的可接受使用相关的隐私
含义
162与法律顾问通力合作,确定演进中的规制对使用客户和
雇员生物计量学数据的影响
第17章人工生成的数据
171制定屏蔽敏感的人工生成数据的政策
172使用非结构化的人工生成数据,提高结构化数据
的质量
173管理人工生成数据的生命周期,降低成本并遵循
规制要求
174从非结构化的人工生成数据中获得洞察力,以丰富
MDM
第四部分行 业 视 角
第18章医疗保健机构
181利用非结构化数据,提高人口稀疏的结构化数据的
质量
182提取从结构化数据中无法获得的更多临床因素
183设定关键业务术语的一致性定义
184确保跨科室的患者主数据的一致性
185与美国HIPAA的规定一致,符合受保护的健康信息的
隐私要求
186创造性管理参考数据,以获得更多临床洞察
第19章公用事业部门
191复制仪表读数
192主关键字的参照完整性
193异常的仪表读数
194客户地址的数据质量
195信息生命周期管理
196数据库监测
197技术架构
第20章通信服务提供商
201大数据类型
202将大数据与主数据进行整合
203大数据隐私
204大数据质量
205大数据生命周期管理
第五部分大数据技术
第21章大数据的参考架构
211大数据源
212开源基础组件
213Hadoop发行版
214流数据分析
215数据库
216大数据整合
217文本分析
218大数据发现
219大数据质量
2110大数据的元数据
2111信息政策管理
2112主数据管理
2113数据仓库与数据集市
2114大数据分析与报告
2115大数据安全与隐私
2116大数据生命周期管理
2117云
第22章大数据平台
221IBM
222甲骨文
223SAP
224微软
225HP
226Informatica
227SAS
228Teradata
229EMC
2210Amazon
2211谷歌
2212Pentaho
2213Talend
附录缩略语列表
译者后记