400-800-8806
您的位置:首页>新闻中心>热门文章

云计算下的智能运维是未来的发展趋势

发布时间:2017-02-24 作者:admin 浏览:2578

        随着越来越多的企业拥抱云计算,为了支持业务系统的快速上线、灵活伸缩以及更高的SLA要求,再加上有限的IT运维成本,运维人员将面临比以往更大的运维压力。在运维拥有海量设备且高度复杂的云数据中心环境时,如何提供99.95%或以上的高质量IT服务,提升效率并降低成本,是运维团队当前面临的最大挑战。

 

  云数据中心的设备规模从几十/几百向几万/几百万数量级演进时,海量硬件设备的使用对硬件故障的快速定位和隔离将带来巨大挑战;同时,采用虚拟化和分布式弹性技术也加剧了云数据中心的复杂度。这些都会导致运维难度增加,小概率故障成为常态且影响加大,用户级的99.95%或以上的服务质量承诺(SLA)很难保障。

 

  虚拟化技术和众多开源技术的引入使得运维变得越来越复杂,传统人工运维模式处理速度慢、出错概率高。此外,传统人均50~100台设备的维护效率,在大规模云化环境下,需要投入大量人力。

 

  保持低运营成本:传统IT的资源使用率通常小于20%,在云化后资源使用率有所提升,但是个性化、按需弹性需求导致资源碎片化、负载不平衡以及扩容规划不精准,可能会造成整体资源利用率并没有达到规划目标,运维成本居高不下。
  
  企业IT向云架构迁移不是一蹴而就的,而是一个长期共存的过程。两种架构导致运维工具差异大,对运维人员也带来了更大的挑战。何实现两种IT架构统一、集中的维护管理,是运维系统面临的新课题。

 
  分布式架构的云计算系统,其资源调度、业务伸缩、故障隔离和故障修复等都是自动化的,不可能基于人工来完成,这已经完全颠覆了传统IT的软件安装部署、业务使用和管理维护模式。因此,运维的工作不再是传统的运维管理,而是构建自动化运维模型和运维工具,这不但对运维人员、更对运维系统提出了新的要求。

  
  实现IT系统全自动化运行的核心在于智能。系统具备完善的智能,才能够基于系统的状态、用户规模、业务体验质量和策略规则等,实现系统的弹性伸缩、故障隔离和故障修复等等,这一切都要靠一个智能的管理系统或者运维系统来完成。

 

  传统模式下,运维人员的工作模式是被动等待问题发生,然后再进行故障处理。根据有关数据统计,运维人员平均每天计划内的工作只占50%左右,剩下的时间都是在到处救火。随着云数据中心规模快速增长,运维人员需要处理的事件量越来越大,人工救火将力不从心。这就需要一个智能的运维平台,利用大数据关联分析与机器学习技术为运维系统赋予人工智能,提供从故障预防到故障定位、再到故障闭环的智能保障能力。

 

  主动故障预防:故障处理再迅速也不如不产生故障,尤其是在大规模云数据中心场景下,即便很低的故障率也会产生一定规模的故障,为了避免到处救火,最好的方法是做好防火工作。

 


   

  为了应对云计算带来的运维难题,网强以自主研发网络管理系统,ITMS流程管理等产品,支持智能化的操作模式,灵活匹配复杂的业务需要和资源监控,支持网络设备、服务器、虚拟机、存储、网络、中间件、数据库、业务应用等多种软硬件资源统一监控,实现全方位立体化监控,根据业务包含资源的关系,生成直观的业务拓扑图,便于业务管理,预测业务瓶颈按模板阈值进行告警,并与运维联动实现自动化IT运维管理,同时能够对IDC各项资源进行集中监控、集中维护、集中性能,实行集中化管理运营,将告警、资源等指标与客户进行关联,实时向客户推送告警,开展IDC主动服务,保证业务正常运行。 

 
客服  
咨询电话:400-800-8806