…orm计划被应用到生产环境。同样的操作之前多次执行都没有问题。导致这次故障的原因是应用变更到生产环境有较长延迟(约3周)。用于资源重建的已知良好的流水线变得过时,并且由于最近的更改而导致配置漂移。 Atlantis 的存在是有道理的,它在前面拦一道,可以有效避免一些平时不容易注意到,但是一但发生会造成 S0 级别事故的 TF 灾难。 对抗人的不精确性的简单办法其实就是增加流程的安全性。 from: @kivin…
[[ Atlantis ]]
1 篇文章提到了此关键词
1 篇文章提到了此关键词
…orm计划被应用到生产环境。同样的操作之前多次执行都没有问题。导致这次故障的原因是应用变更到生产环境有较长延迟(约3周)。用于资源重建的已知良好的流水线变得过时,并且由于最近的更改而导致配置漂移。 Atlantis 的存在是有道理的,它在前面拦一道,可以有效避免一些平时不容易注意到,但是一但发生会造成 S0 级别事故的 TF 灾难。 对抗人的不精确性的简单办法其实就是增加流程的安全性。 from: @kivin…