时间:2015-08-31 15:05:23 来源: 复制分享
数据中心运维是数据中心长期稳定的保障,非常重要。但是运维工作也是异常辛苦,经常要加班到深夜,并且全年无休,尤其一旦遇到突发故障,在恢复之前都得不到休息,所以有人形象地描述:锄禾日当午,不如运维苦,对着破电脑,一调一下午,这是对数据中心运维工作的真实写照。正因为这样,从事数据中心运维工作的年轻人偏多,是因为没有人能够干得长久,年轻人体力好,刚开始有热情还可以坚持,时间长了就很难维持了。本来数据中心行业这几年得到了高速发展,需要更多的运维人员,但是这类人才却越来越少了,尤其是现场维护的人员。造成这样结果的有两个原因:一是人们总是觉得这些运维工作含金量不高,和数据中心架构设计方面的人才没有可比性,这样导致不愿意为这些运维人员付出更高的工资;二是做信息系统运维主要需要年轻人,年轻人比较好接受这些新鲜的事物和概念,但年轻人都比较浮躁,不安分,要长时间和一群设备打交道,时间短可以,时间长了厌烦之心油然而生。本文介绍一种运维的新方式,也许对于数据中心运维人员是一种解脱,也可能是未来数据中心最重要的运维工作方式。
那就是远程运维。顾名思义,远程运维就是人不在现场,通过远程登陆的方式来管理设备。其实这种方式在很多数据中心都存在,现在一个数据中心,我们也很少要拿着电脑和串口线跑到机房里去操作设备,一般在机房外面直接就可以远程登陆操作设备。只有遇到了需要插拔光纤、拔插板卡等操作时,才需要跑到机房里,设备旁去操作。不过为了确保数据中心安全,对于外部,则要做很多防护策略。所以很多时候我们在外部时就无法访问数据中心,这样一旦发生故障,就需要往数据中心赶,无法及时处理。虽然数据中心都安排人24小时值班,但是由于每个人精通的技术都不同,一旦出了问题,值班的人未必对发生的故障了解,就需要安排其他人员处理,要让最了解的人分析问题,这时就面临无法登陆数据中心的问题。有的数据中心在世界各地都有机房,等人赶到机房黄瓜菜都凉了。这时就需要远程运维,远程运维就是将数据中心内的运维工作转移到了数据中心外,将运维的工作圈扩到很大。
远程运维有几种工作方式:1是通过VPN方式拨入,这种方式安全性高,一般可以使用TeamViewer(收费软件,一般只能试用一个月),VPN SSL等拨入方式,这些VPN软件需要两边都有人,双方输入Parnter码,由数据中心外部人员通过远程的方式来控制内部的电脑,然后电脑再连接到数据中心网络中,这样就可以实现远程运维;2是通过远程桌面的方式,在QQ、阿里旺旺等这些聊天工具都提供远程协助功能,通过这种方式就可以控制对方的电脑,在数据中心内部可以放置一部可以上Internet网的4G手机,这样可以轻松实现互联;3.以上两种方式都需要在数据中心内部有人配合才行,还可以在数据中心内部部署几个公网地址,供外部登陆访问使用。一旦数据中心有异常,就可以直接通过Internet登陆公网地址,然后再去检查目的设备,这种方式最方便,不需要数据中心内部有人,大大减少了需要运维的人,也是无人职守数据中心唯一的运维方式;4是针对越来越多的远程运维方案,也有不少第三方公司开始推出专业的远程运维服务,对网络设备进行维护,既可以在设备的附近安装客户端实现,也可以在远离设备的地方安装客户端来实现。不过这个需要数据中心来增加投资,而且需要在各个数据中心节点内部都进行部署,工作量不小,但是这个才是未来数据中心运维的趋势。未来的数据中心也许机房遍布全球,但是运维可以只需要几个人,这些人集中在一起并不需要全球到处跑就可以管理数据中心,还可以请专业的运维公司来管理。其实现在不少的数据中心都和专业的服务公司签定一定年限的运维合同,就是希望可以得到专业的运维保障,这是未来数据中心运维的主要发展方式,而远程运维是实现这样方式的根本。因为如果机房建在了某个小县城里,不可能在当时有非常高端的,精通数据中心技术的人员,而在北京、上海却聚集着大量的高精尖技术人员,所以只能靠远程运维管理。
当然,有了远程运维也不是一劳永逸。有时数据中心故障是千奇百怪的,出了故障时,有些网络设备甚至是无法访问和登陆的,这就使得远程运维不灵光了,只能到机房里,来到设备旁通过串口操作,有时甚至设备没有任何响应,只能现场操作重启或者更换,这时远程运维就不管用了。还有就是很多远程方式还是需要现场有人来配合操作,这样才能完成远程运维,一定程度上也是增加了运维的人力,而且远程的人对现场情况不是很清楚,如果现场有人,可以对故障现场有个清晰的了解,这对迅速找到故障原因非常重要,如果没有人,那只能根据客户反馈的故障现场来一点点检查,很多时候其实并不需要什么技术专家来排查网络故障的,稍有一些网络经验的人至少可以很快找到故障设备,那么涉及设备内部实现细节再可以找专家来分析,这样也可以节省远程运维的开销。
远程运维也许是未来数据中心主流的工作方式,虽然这种方式有一定的局限性,但是作为一个数据中心运营企业很难拥有各个方面都精通的技术人才,很多时候遇到的各种问题都需要借助外部的人员来帮助解决,这时远程运维非常必要,这就像远程医疗,医生都可以通过网络远程给病人看病,对于数据中心也同样如此。