首页 » 博客 » 这种新的基于云的环境意味着主机可

这种新的基于云的环境意味着主机可

能会随时被终止和替换,因此需要为此类限制做好准备。工程团队随后提出了通过随机重启自己的主机进行测试的想法。这使 Netflix 能够发现任何可能的弱点,同时验证他们自己的补救自动化是否正常工作,从而增强了对Chaos Monkey 开发服务的需求。 Chaos Monkey 招聘指南 7 招聘指南 Netflix 设计了 ​​Chaos Monkey 作为他们自己的混沌工程版本,通过在其云架构中以伪随机方式执行服务和实例来强制失败,从而测试其系统稳定性。

通过这种故意制造的混乱

和混沌工程的力量,开发人员和工程师能够看到当基 罗马尼亚资源 础设施的关键组件被关闭时系统如何响应。 从本质上讲,混沌工程和 Chaos Monkey 本身可以告诉开发人员系统在遇到中断时如何有效地转移资源。这在 Amazon Web Services 服务器中的云计算实例中尤其有用。Chaos Monkey 会随机终止虚拟机中的实例以及在生产环境中运行的容器,以更频繁地暴露故障并帮助构建弹性服务。

可配置的时间表允许在指

定时间发生模拟故障,以便开发人员能够密切监视它们。这有 阅读好书和文学作品 助于为重大意外错误做好准备,而不是简单地等待灾难发生并在事后做出反应。通常,混沌工程在测试中通常遵循 4 个步骤: 工程师和开发人员将“稳定状态”定义为系统的可测量输出,以作为正常行为的基线。 然后,团队假设在故障模拟过程中,这种稳定状态将如何在对照组和实验组中持续并做出反应。

工程师引入变量来反映

可能导致灾难性故障的问题和现实事件,例如崩溃、硬盘 广告库 故障、网络连接中断等。 在观察系统反应后,研究团队试图通过寻找对照组和实验组之间的差异来推翻这一假设。 一般来说,系统的稳定状态越难被破坏,企业和开发团队对系统的正常运行时间和用户体验的信心就越大。混沌工程领域,特别是 Chaos Monkey,仍然相对较新,但大型公司需要这类系统和软件测试人员,因为这些公司需要知道他们的系统无论在何种情况下或与云计算相关的外部因素下都能完全运行。

 

滚动至顶部