400-800-8806
您的位置:首页>新闻中心>热门文章

数据中心机房安全,我们疏忽了什么?

发布时间:2017-12-28 作者: 浏览:793


数据中心机房的安全是网络正常运行的前提,一旦发生故障将给企业以及人们带来极大的损失和不便,轻者造成机房设备受损,降低使用寿命;重者造成设备损坏和信息丢失,带来严重甚至无法挽回的经济损失,数据中心安全“事故”频频发生,到底是天灾,还是人祸!

先是一铲子引发支付宝瘫痪,携程无法服务,接着IDC被雷劈中,准确的说是云服务提供商青云qingcloud的IDC机房被雷劈中了……这一系列的故障,既有天灾又有人祸,非常值得我们警醒地看待数据中心安全及灾备能力。故障突然发生的一刻,网络运维人员是否真的能在最短时间内有效地完成故障处理,系统是否真的能如预案中快速恢复,这些都是对数据中心故障处理能力的实际考量。

 

数据中心宕机原因分析:

网上有各种说法,有说是数据库数据和备份数据被物理删除的,也有说是各个节点的业务代码被删除 现在重新在部署,也有说是误操作,导致业务不可用,还有说是黑客攻击甚至是内部员工恶意破坏的。

但是从现象上看,确实是携程的应用程序和数据库都被删除。最大的可能还是运维人员在正常的批量操作时出现了误操作。


导致数据中心机房事故发生的到底是天灾还是人祸:

1、“天灾”

对机房而言,最大的天灾莫过于:火灾、地震、雷击等天然灾害——导致数据中心事故,数据中心也有很多的技术手段可以最大程度上避免灾害的发生,针对每一种自然灾害数据中心都需要加以重视,才能躲避开这些自然灾害。

比如增加机柜和机房地面的固定螺丝,安装避雷针,增加放火报警系统和防火器材,当出现这些自然灾害时,减少对数据中心的冲击。


2、“人祸”

人为故障导致的数据中心故障占数据中心的故障中的70%,其中也可以分为有意的和无意的。有意的是通过造成数据中心故障来达到窃取或损坏数据的目的。无意的是指本意并不想破坏数据中心,但是由于自己的技术积累经验不够或者疏忽,自己的操作引发了数据中心故障,这种故障占到了人为故障的80%以上。

数据中心是一个复杂庞大的系统,不可能一个人面面俱到都精通,当接触到自己不熟悉或不了解的地方,操作往往引发意想不到的结果,因此加强对人的管理尤为重要。在对数据中心做任何调整时,都要从全局考虑,集中最优秀的技术人员,将人为操作风险降低。


3、设备故障

除了以上的天灾人为导致数据中心故障,大型的数据中心拥有数千台设备很普遍,这些电子设备难免运行中出现故障,一旦出现故障,就需要对设备进行分析,很多现场操作人员并不具备分析问题的能力,为了恢复业务,只能重起设备,或者将业务切割到别的备份设备上。当故障设备上没有业务或者已经重起了,其上很多时时记录都会冲掉,这样给故障分析带来难度。数据中心不怕出故障,怕的是出了故障后找不到原因,这相当于给数据中心埋了一个定时炸弹。


数据中心安全我们疏忽了什么?

由上不难看出数据中心安全事故对于企业及用户影响之深,正所谓“三分技术,七分管理”,大量的事实表明,数据中心的好与差评判标准都是由管理水平的高低所决定的。

对于自然灾害我们从机房设备着手去管理,而对于人祸、故障,我们就需要套完善的机房管理系统来把数据中心机房整个监控起来,支持温湿度、烟雾、漏水、电源、气体浓度、红外、门禁、视频监控系统、空调及UPS等机房动力环境监控与管理将人祸几率减少到最低,当故障发生时,根源分析,定位故障源,通过客户端告警、短信告警、电话告警、微信告警、消息框、远程声音等多种告警方式,第一时间通知运维人员故障的原因、故障所在的位置。避免造成大的损失。


不管是天灾还是人祸,数据中心安全值得重视,从初期规划设计、到后期网络运维管理都应遵照一定的标准,以确保数据中心安全运行,数据中心安全容不得丝毫马虎!


 

 
客服  
咨询电话:400-800-8806