随着云计算的迅猛发展,越来越多的业务迁移至云端,众多企业在审计成本的过程中发现,用来支撑业务的云成本并没有节省,费用支出反而比以前更大。如何降低云成本成为企业的核心诉求和通用诉求。为此,Linux 基金会成立了专门的FinOps 基金会,致力于通过培训、方法论和最佳实践的输出,助力企业优化云成本。Cloud FinOps 正是这些云成本优化规则和最佳实践的集合。它提供了由中心化团队驱动,将云成本职责下发到分布式团队的实践方法。并由工程团队、财务团队、产品团队通过跨团队合作,保证成本在可预测、可管控的前提下,实现更快速的产品能力交付。本书是第一本系统性解读什么是FinOps,以及如何实施FinOps 的书:它定义了在云成本优化领域的众多技术术语、财务术语,分享了企业要推动云成本优化所必须完成的组织架构调整、流程推动、职责划分,以及所需要依托的常见技术手段,等等。本书收录了来自FinOps 基金会社区大量的实践案例,能让读者了解成功的云成本优化故事,以及背后成功的原因。此外,对主流云厂商提供的技术能力做了剖析,让读者在选择云技术解决成本优化问题时有所参照。本书适读的对象较广,包括使用云计算的企业中的各种角色,如决策层、运维工程师、财务和采购人员,以及提供云成本优化方案的云服务提供商和第三方集成商。本书包含大量财务术语和技术术语,如果你具备相关的财务或者技术知识,对阅读本书会有事倍功半的效果。
J.R. Storment 是Cloudability 公司(现为Apptio Cloudability)的联合创始人。在过去十年的大部分时间里,他与世界上数百家最大的云消费者—从GE 到Spotify 到BP 到Nike 到 Uber—一起帮助这些公司设计策略,通过技术、文化和流程来优化和分析这些公司的云支出。他现在是Apptio Cloudability 的FinOps 副总裁兼FinOps 基金会主席。J.R. 在美国、亚太地区、英国和欧盟的多个AWS re:Invents 和数十场会议上就云成本优化发表了演讲。Mike Fuller 过去七年一直在Atlassian 公司的澳大利亚悉尼总部工作,目前担任云研发团队(云卓越中心)的首席系统工程师。因为职位原因,Mike 在Atlassian 公司与大多数AWS 服务合作,并协助Atlassian 公司内部的团队以高安全性、高可用性和合理的成本效率运行。Atlassian 公司的云研发团队负责整个公司的大规模云架构的最佳实践的设计、治理和实施。
孟凡杰,腾讯云容器技术专家,FinOps 产品研发负责人,开源项目Crane 联合创始人,致力于借助云原生调度能力辅助企业优化云成本。曾在IBM、EMC、eBay 等外企担任云计算资深架构师等职位,是Kubernetes 社区贡献者,专注调度、多云、网络、服务网格等技术领域。著有《Kubernetes 生产化实践之路》一书。极客时间《云原生训练营》讲师。王孝威,腾讯云技术产品经理,FinOps 中国首位认证从业者,开源项目Crane 和腾讯云降本增效产品Housekeeper 产品负责人。云原生技术实战营、云原生正发生、K+ 讲师。胡启明,腾讯云容器技术专家,开源项目Crane 联合创始人和负责人。曾任职于蚂蚁集团,SAP 等公司,专注云原生领域八年,是Kubernetes、Dapr、KubeFed 等项目的贡献者。GDCC、CSDN 降本增效专栏、Open Infra Days 讲师。
目录
前言................................................................................ xxi
第一部分 FinOps 简介
第1 章 什么是FinOps......................................................... 3
FinOps 英雄之旅 ........................................................................................................... 3
FinOps 从何而来 ........................................................................................................... 5
定义 .............................................................................................................................. 6
实时报告(“普锐斯效应”) ........................................................................................... 7
FinOps 的核心原则 ....................................................................................................... 9
应该从何时开始使用FinOps ...................................................................................... 10
从内心的终极目标开始:单位经济学 ........................................................................ 11
总结 ............................................................................................................................ 11
第2 章 为什么选择FinOps...................................................13
合理运用云 ................................................................................................................. 13
相关问题 ..................................................................................................................... 14
缺少FinOps 体系的后果 ............................................................................................. 16
总结 ............................................................................................................................ 16
第3 章 文化转变和FinOps 团队的关系.....................................19
谁在运行FinOps ......................................................................................................... 19
为什么需要一个中心团队 ................................................................................... 21
各个团队在FinOps 中扮演的角色 ...................................................................... 21
xii | 目录
合作的新途径 ............................................................................................................. 22
FinOps 团队的定位 ..................................................................................................... 23
深入理解背后动机 ...................................................................................................... 24
工程师 ................................................................................................................. 24
财务人员 ............................................................................................................. 25
高管 ..................................................................................................................... 25
采购人员 ............................................................................................................. 26
贯穿始终的FinOps ..................................................................................................... 26
FinOps 人员招聘 ......................................................................................................... 26
FinOps 文化落地实践 ................................................................................................. 27
总结 ............................................................................................................................ 28
第4 章 FinOps 语言与云语言............................................... 29
定义通用语言 ............................................................................................................. 29
基本术语的定义 .......................................................................................................... 30
为云计算专家定义的财务术语 ............................................................................ 32
抽象化以助理解 .......................................................................................................... 34
云语言与业务语言 ...................................................................................................... 35
在DevOps 与财务团队之间建立理解的枢纽 .............................................................. 36
教育双方的必要性 ...................................................................................................... 36
基准评价与团队竞争 .................................................................................................. 37
总结 ............................................................................................................................ 37
第5 章 对云账单的剖析....................................................... 39
云计费的复杂性 .......................................................................................................... 39
账单数据的基本格式 .................................................................................................. 40
放过我,时间! .......................................................................................................... 41
不积小流,无以成江海 ....................................................................................... 42
云账单的数据简史 .............................................................................................. 42
每小时数据的重要性 .................................................................................................. 44
一个月不再是一个月 .................................................................................................. 44
一美元不再是一美元 .................................................................................................. 45
支出计算公式 ............................................................................................................. 45
影响账单的两个杠杆 ........................................................................................... 46
谁该规避成本,谁该降低费率 ............................................................................ 46
目录 | xiii
为什么要去中心化优化用量 ............................................................................... 47
总结 ............................................................................................................................ 48
第二部分 告知阶段
第6 章 FinOps 生命周期.....................................................51
FinOps 六大原则 ......................................................................................................... 51
团队协作 ............................................................................................................. 51
云的商业价值推动公司决策 ............................................................................... 52
云资源优化人人有责 ........................................................................................... 52
FinOps 报告能被即时访问 .................................................................................. 52
中心化团队驱动FinOps ...................................................................................... 52
有效利用云的可变成本模型 ............................................................................... 53
FinOps 的生命周期 ..................................................................................................... 53
告知 ............................................................................................................................ 54
优化 ............................................................................................................................ 55
运营 ............................................................................................................................ 56
注意事项 ..................................................................................................................... 58
你该从何处启程 .......................................................................................................... 58
为何实践需要从头开始............................................................................................... 59
总结 ............................................................................................................................ 60
第7 章 自我定位.................................................................61
缺乏上下文的数据毫无意义 ....................................................................................... 61
寻找第一个共识 .......................................................................................................... 62
本阶段的组织任务 ...................................................................................................... 64
透明度与反馈循环 ...................................................................................................... 64
团队绩效测评 ............................................................................................................. 65
预测与预算 ................................................................................................................. 66
团队管理预算的重要性............................................................................................... 67
至高无上的原则:从爬到走,再到跑 ........................................................................ 69
总结 ............................................................................................................................ 70
第8 章 成本分配:不遗漏一分钱..............................................71
为什么分配很重要 ...................................................................................................... 71
xiv | 目录
费用分摊与费用展示 .................................................................................................. 72
选择合适的模型组合 ........................................................................................... 72
费用展示模型实践 ...................................................................................................... 74
费用分摊和费用展示的注意事项 ................................................................................ 74
分摊成本 ..................................................................................................................... 75
摊销:这是权责发生制的世界 ................................................................................... 76
与会计建立商誉和审计............................................................................................... 78
使用TBM 分类法帮助云计算 ..................................................................................... 78
“消费恐慌”临界点 .................................................................................................... 80
总结 ............................................................................................................................ 82
第9 章 标记,标签,账号,天哪!.......................................... 83
基于标签和层次结构的成本分配方法 ........................................................................ 83
开始你的策略 ...................................................................................................... 85
比较三巨头的分配方案 ....................................................................................... 86
比较账户和文件夹,标记和标签 ........................................................................ 87
使用谷歌云平台中的文件夹组织项目................................................................. 88
标记和标签:最灵活的分配选项 ................................................................................ 89
使用标记计费 ...................................................................................................... 90
尽早开始标记 ...................................................................................................... 90
什么时候设置标记标准 ....................................................................................... 91
制定正确的标记数量 ........................................................................................... 91
标记/ 标签的限制 ............................................................................................... 92
维护标记的完善性 .............................................................................................. 93
标记应用报告 ...................................................................................................... 93
让团队实施标记 .......................................................................................................... 94
总结 ............................................................................................................................ 94
第三部分 优化阶段
第10 章 通过调整优化达到目标.............................................. 97
为什么设定目标 .......................................................................................................... 97
第一个目标是实现合理的成本分配 ............................................................................ 97
节省是目标吗 ............................................................................................................. 98
铁三角:好、快、便宜 ....................................................................................... 99
目录 | xv
用OKR 实现目标 ..................................................................................................... 100
OKR 关注领域1: 可信度 .................................................................................. 100
OKR 关注领域2 :可持续性 ............................................................................. 100
OKR 关注领域3: 控制 ...................................................................................... 101
制定目标战略线 ........................................................................................................ 102
检测异常 ................................................................................................................... 104
通过减少开支来达到预期 ......................................................................................... 105
用得少与花得少 ................................................................................................ 105
总结 .......................................................................................................................... 105
第11 章 减少使用:使用率优化............................................. 107
云消费的冰冷现实 .................................................................................................... 107
浪费从哪里来 ........................................................................................................... 108
通过清理/ 移动减少使用 .......................................................................................... 109
通过调整资源利用减少使用( 规格调整) ................................................................. 109
常见的调整使用的误区 ..................................................................................... 110
不只是EC2 :存储成本的控制建议 .................................................................. 112
通过重新设计减少使用............................................................................................. 114
弹性 ................................................................................................................... 114
按计划运作........................................................................................................ 114
预留实例的影响 ........................................................................................................ 114
收益vs 投入 .............................................................................................................. 115
无服务器计算 ........................................................................................................... 116
并非所有的浪费都是浪费 ......................................................................................... 117
爬、走、跑 ............................................................................................................... 118
高级工作流程:自动选择退出调整 .......................................................................... 118
追踪优化节省 ........................................................................................................... 121
总结 .......................................................................................................................... 123
第12 章 减少支出:费率优化............................................... 125
计算资源定价 ........................................................................................................... 125
按需 ................................................................................................................... 125
现货/ 可被抢占的/ 低优先级资源 .................................................................... 126
预留 ................................................................................................................... 126
存储资源定价 ........................................................................................................... 126
xvi | 目录
批量使用折扣 ........................................................................................................... 127
基于使用 ........................................................................................................... 127
基于时间 ........................................................................................................... 128
协议费率 ................................................................................................................... 128
定制的定价协议 ................................................................................................ 129
销售的私人定价 ................................................................................................ 129
BYOL 注意事项 ........................................................................................................ 129
总结 .......................................................................................................................... 129
第13 章 使用预留实例和承诺使用折扣减少支出.......................... 131
预留概览 ................................................................................................................... 131
预留和承诺的使用 .................................................................................................... 133
实例规格的灵活性 ............................................................................................ 134
转换和取消........................................................................................................ 135
三巨头提供的使用承诺概述 ..................................................................................... 135
AWS .......................................................................................................................... 135
预留实例提供什么 ............................................................................................ 136
AWS 预留实例的参数 ....................................................................................... 136
匹配关联账户 .................................................................................................... 137
标准预留实例与可转换预留实例 ...................................................................... 139
实例大小的灵活性 ............................................................................................ 140
节省计划 ........................................................................................................... 142
GCP ........................................................................................................................... 143
不为虚拟机实例按小时付费 ............................................................................. 144
账单和共享的承诺使用折扣 ............................................................................. 144
组织与计费账户的关系 ..................................................................................... 145
在项目中应用承诺使用折扣 ............................................................................. 146
Azure ........................................................................................................................ 146
实例规格的灵活性 ............................................................................................ 147
总结 .......................................................................................................................... 149
第14 章 RI 和CUD 策略................................................... 151
常见的错误 ............................................................................................................... 151
构建RI 策略的步骤 .................................................................................................. 152
学习基础知识 .................................................................................................... 152
目录 | xvii
构建可重复的RI 流程 ....................................................................................... 155
定期购买和长期购买 ......................................................................................... 156
衡量有效性,不断迭代 ..................................................................................... 156
合理分配RI 成本 .............................................................................................. 156
集中式预留模型 ........................................................................................................ 157
预留时机 ................................................................................................................... 158
何时调整规格与预留 ................................................................................................ 159
构建你的战略 ........................................................................................................... 160
对云服务提供商的承诺级别 ............................................................................. 160
资本成本 ........................................................................................................... 161
红区/ 绿区法 ..................................................................................................... 161
采购批准 ........................................................................................................... 162
谁为预留付款 .................................................................................................... 163
策略建议 ........................................................................................................... 164
总结 .......................................................................................................................... 165
第四部分 运营阶段
第15 章 对齐团队和商业目标............................................... 169
完成目标 ................................................................................................................... 169
流程 .......................................................................................................................... 170
加入(Onboarding) ........................................................................................... 170
责任(Responsibility) ....................................................................................... 171
可视化(Visibility) ........................................................................................... 171
行动(Action) ................................................................................................... 172
责任制强化文化 ........................................................................................................ 173
胡萝卜加大棒 .................................................................................................... 173
与差成员一起工作 ............................................................................................ 173
将运营付诸行动 ........................................................................................................ 174
总结 .......................................................................................................................... 175
第16 章 指标驱动成本优化.................................................. 177
核心原则 ................................................................................................................... 177
自动测量 ........................................................................................................... 178
目标 ................................................................................................................... 178
xviii | 目录
可实现的目标 .................................................................................................... 178
数据驱动 ........................................................................................................... 181
指标驱动的流程与节奏驱动的流程 .......................................................................... 182
设定目标 ................................................................................................................... 183
采取行动 ................................................................................................................... 183
总结 .......................................................................................................................... 184
第17 章 自动化成本管理..................................................... 185
自动化的目标是什么 ................................................................................................ 185
你想要实现的结果是什么 ................................................................................. 185
自动任务与手动任务 ......................................................................................... 186
自动化工具 ............................................................................................................... 186
成本 ................................................................................................................... 187
其他注意事项 .................................................................................................... 187
工具部署选项 .................................................................................................... 188
自动化协同工作 ........................................................................................................ 188
集成 ................................................................................................................... 188
自动化冲突........................................................................................................ 189
安全 .......................................................................................................................... 189
如何开始 ................................................................................................................... 190
自动化内容 ............................................................................................................... 191
标签治理 ........................................................................................................... 191
计划资源启动/ 停止 ......................................................................................... 191
减少使用量........................................................................................................ 191
总结 .......................................................................................................................... 191
第18 章 容器世界的FinOps............................................... 193
初识容器 ................................................................................................................... 193
迁移到容器编排引擎 ................................................................................................ 195
容器FinOps 生命周期 .............................................................................................. 196
容器告知阶段 ........................................................................................................... 196
成本分配 ........................................................................................................... 196
容器比例 ........................................................................................................... 197
标记、标签和命名空间 ..................................................................................... 199
容器优化阶段 ........................................................................................................... 199
目录 | xix
集群部署 ........................................................................................................... 199
容器用量优化 .................................................................................................... 200
服务器实例费率优化 ......................................................................................... 202
容器运营阶段 ........................................................................................................... 202
无服务器容器 ........................................................................................................... 202
总结 .......................................................................................................................... 203
第19 章 管理单位经济学:FinOps 涅..................................205
作为单位经济学基础的指标 ..................................................................................... 205
回到铁三角 ............................................................................................................... 208
基于活动的成本核算 ................................................................................................ 210
计算方式中缺少什么 ................................................................................................ 211
总结 .......................................................................................................................... 212
下一步是什么 ........................................................................................................... 212
关于优先级的后记(来自J.R.) .............................................. 215
词汇表............................................................................ 217