本书是一种系统地、全面地阐述IT服务连续性知识体系的专著,旨在为社会培养IT服务连续性领域的人才,为数据中心开展IT服务连续性活动提供详细指引,帮助数据中心实现“少停机、少丢数、少花钱”的夙愿。本书基于大量图表,直观地阐述以下内容:IT服务连续性涉及的IT服务、业务、IT资源、IT流程、IT组织和IT事件等方面的基础概念和知识。企业各条线的IT事件应急处置行动框架与IT事件应急处置机制。以IT服务连续性目标为导向建设IT应急响应机制、高可用恢复机制和灾难恢复机制的活动框架。IT服务连续性管理活动框架,包括实现IT服务连续性所必须具备的项目管理、运维管理、IT应急处置机制就绪管理、风险管理、IT应急处置机制持续更新管理、绩效管理、内部控制和内部审计活动。本书的读者对象包括IT应急管理人员、IT规划设计人员、IT项目管理人员、IT运维管理人员、IT风险管理人员、IT绩效管理人员、IT内部控制人员、IT内容审计人员以及准备迈入数据中心大门的所有IT人士。
目录
第1章IT服务剖析 1
1.1IT服务 1
1.2业务 3
1.3IT资源 6
1.3.1IT资源框架 6
1.3.2应用系统 7
1.3.3IT基础设施 10
1.3.4IT资源的属性 10
1.3.5IT资源属性与IT服务属性的映射关系 11
1.4IT流程 12
1.5IT组织 13
第2章IT事件剖析 16
2.1IT事件定义 16目录
第1章IT服务剖析 1
1.1IT服务 1
1.2业务 3
1.3IT资源 6
1.3.1IT资源框架 6
1.3.2应用系统 7
1.3.3IT基础设施 10
1.3.4IT资源的属性 10
1.3.5IT资源属性与IT服务属性的映射关系 11
1.4IT流程 12
1.5IT组织 13
第2章IT事件剖析 16
2.1IT事件定义 16
2.2IT事件前因 16
2.2.1IT威胁源 17
2.2.2IT威胁源消减措施 18
2.3IT事件类别 19
2.4IT事件后果 20
2.4.1IT损害 20
2.4.2IT事件影响 21
2.5IT事件级别 23
2.6IT服务连续性的意义 24
第3章IT事件应对过程 26
3.1IT事件闭环应对过程 26
3.2IT事件防范 27
3.3IT事件监测预测 27
3.4IT事件应急处置 28
3.4.1重大IT事件应急处置案例 28
3.4.2IT事件应急处置行动框架 35
3.4.3IT事件预警与预警响应 35
3.4.4IT事件先期处置 39
3.4.5IT事件后果评估 41
3.4.6IT事件恢复决策 46
3.4.7IT事件恢复 48
3.4.8重大IT事件应急保障 52
3.5重续运行 52
第4章IT事件应急处置机制 55
4.1IT应急处置机制 55
4.1.1IT应急响应机制 56
4.1.2高可用恢复机制 58
4.1.3灾难恢复机制 61
4.2企业层面IT事件应急处置机制 68
4.3业务条线IT事件应急处置机制 71
第5章IT应急处置机制开发过程 74
5.1IT应急处置机制开发活动框架 74
5.2风险分析 75
5.3业务影响分析 77
5.3.1获取企业层面和业务条线的BIA结果 78
5.3.2IT关联性分析 78
5.3.3应用系统影响分析 79
5.3.4定义重要信息系统 80
5.3.5定义重要信息系统的启停顺序 80
5.3.6定义信息系统灾难RTO 81
5.3.7定义信息系统灾难RPO 81
5.4IT应急处置策略开发 82
5.4.1IT应急响应策略开发 83
5.4.2高可用恢复策略开发 85
5.4.3灾难恢复策略开发 86
5.5灾备中心选址 94
5.5.1确定候选城市 94
5.5.2初步筛选候选城市 94
5.5.3比对并确定异地灾备中心所在城市 95
5.5.4确定灾备中心的具体地址 96
5.6IT应急处置资源设计 97
5.6.1关键技术POC 98
5.6.2生产环境改造设计 98
5.6.3高可用备份系统设计 100
5.6.4灾备系统设计 103
5.6.5自动化灾备指挥与切换平台设计 115
5.6.6IT应急指挥中心设计 116
5.7IT应急处置资源实施 116
5.8IT应急预案开发 118
5.8.1IT总体应急预案开发 118
5.8.2IT先期处置预案开发 120
5.8.3高可用恢复手册开发 120
5.8.4灾难恢复预案开发 121
5.8.5其他条线的IT事件应急预案开发 122
5.9应急演练 123
5.9.1高可用备份系统切换演练 123
5.9.2灾备演练 124
第6章IT服务连续性管理过程 130
6.1IT服务连续性管理活动框架 130
6.2IT应急处置机制开发项目管理 131
6.2.1管理活动 132
6.2.2管理过程 137
6.2.3管理角色与职责 138
6.3IT应急处置资源运维管理 139
6.3.1管理活动 139
6.3.2管理过程 142
6.3.3管理角色与职责 143
6.4IT应急处置资源风险管理 143
6.4.1管理活动 143
6.4.2管理过程 150
6.4.3管理角色与职责 152
6.5IT应急处置机制就绪管理 152
6.5.1管理活动 153
6.5.2管理过程 156
6.5.3管理角色与职责 158
6.6IT应急处置机制持续更新管理 159
6.6.1管理活动 159
6.6.2管理过程 161
6.6.3管理角色与职责 162
6.7IT服务连续性绩效管理 162
6.7.1管理活动 163
6.7.2管理过程 170
6.7.3管理角色与职责 171
6.8IT服务连续性内部控制 172
6.8.1管理活动 172
6.8.2管理过程 175
6.8.3管理角色与职责 177
第7章IT服务连续性管理体系 178
7.1IT服务连续性管理体系框架 178
7.2IT服务连续性管理体系的边界环境 179
7.2.1企业业务连续性管理体系 180
7.2.2IT服务连续性内部审计机制 183
7.2.3IT服务连续性法规 184
7.2.4IT服务连续性SLA 185
7.2.5IT服务连续性管理规范 185
7.3IT服务连续性管理体系成熟度模型 186
第8章IT服务连续性内审的关键审核事项 189
8.1IT应急处置机制开发审计 189
8.1.1IT应急响应机制开发审计 189
8.1.2高可用恢复机制开发审计 191
8.1.3灾难恢复机制开发审计 192
8.2IT应急处置机制开发项目项目管理审计 198
8.3IT应急处置资源运维管理审计 200
8.4IT应急处置资源风险管理审计 201
8.5IT应急处置机制就绪管理审计 202
8.6IT应急响应与恢复行动审计 203
8.7IT应急处置机制持续更新管理审计 203
8.8IT服务连续性绩效管理审计 204
8.9IT服务连续性内控审计 205
附录A高可用风险检查列表库 207
姚强,华北电力学院计算机及其应用专业92届毕业生,DRII认证业务连续性专家(认证号:10180),曾服务于IBM、EMC、 SUN(ORACLE)、CENTRIN、TEAMSUN等多家知名企业,曾在中国民生银行、中国国航、中国银联、苏格兰皇家银行、广州电信等企业的IT服务连续性项目中担任首席咨询顾问,多年来以“促进国内数据中心少停机、少丢数、少花钱”为使命,坚守在数据中心第一线,坚定不移地致力于IT服务连续性理论及国际最佳实践的研究、引进和推广工作,开创性地建立了IT服务连续性知识体系。