IT运营平台的人工智能,人们称之为AIops,是一类不断发展和广泛使用的技术,在过去几年中,这类技术被归类为IT运营分析。对于那些很关注市场的人而言,智能运维的发展是显而易见的,但如果您需要一些统计数据的话, Gartner报告称,到2022年,将有40%的大型企业使用智能运维工具来支持或替换监控工作及服务台工作,而目前这一比例为5%。
这是一个相当大的跳跃。然而,这也表明许多企业可能会将智能运维工具用于错误的目的——这些错误可能造成数百万美元的损失。以下是我所看到的情况。
使用智能运维工具来修复较差的云架构和部署工作。那些没有为企业设计合适的云解决方案的人,甚至没有将本地解决方案与公共云相结合的人,都在试图解决系统性问题。糟糕的设计会导致出现一些性能问题,以及导致智能运维的中断。
就像“您无法解决一个愚蠢的问题”一样,在应用和正确使用智能运维工具之前,需要纠正那些规划较差的架构。智能运维工具会假定该解决方案的配置是合理的,然后才能正确地处理警报和解决方案。如果不按此顺序进行操作,那么您将只能够告诉智能运维系统如何将来自云系统和非云系统的千兆字节数据进行关联,并尝试解决那些不太可能完成的问题,因为这些问题会引发其他警报和触发其他操作。
希望智能运维工具能够减少人员和成本。实际上,那些从事云运维工作的人正在创建一门新学科。企业已经看到了云运维专家数量的增长,并且他们有着相当不错的薪水。这就推高了成本,降低了他们认为通过使用公共云会获得的价值。
我已看到一些企业基于商业案例对智能运维工具进行投资,该案例针对于使用更少的运维人员,并且能够根据运维模式自动得出成本。尽管未来有进一步降低成本和减少人员的潜力,但智能运维需要大量的运维专业知识。通常,您会看到智能运维会推动云运维团队人员的增加,并且初期的成本至少在几年内会上涨。但您必须为提高效率进行投资;您不能在减少投资的同时期望获得好的结果。
使用智能运维来提供更好的安全性。那些从事云安全工作的人已经知道,运维自动化流程不是保护云端应用程序和数据的好方法。事实上,考虑到您将要应对更复杂的安全系统,将智能运维与云安全工作结合起来实际上会降低安全性。
为了有效地使用,智能运维工具必须非常谨慎地进行部署。市场的发展速度如此之快,难免会发生错误。但基于常识,您会发现智能运维最终会为您提供想要的价值。