时间:2015-02-15 17:00:00 来源: 复制分享
在数据中心供应商和设施类型方面作出正确选择,才不会在今后因为服务能力不足和各种错误付出高昂的学费。
无论你是希望将你的数据中心外包,迁移到新的设施,还是计划进行升级,你都应该在计划付诸行动之前用心进行反复的审查。
这里提供了一份独立于供应商的数据中心审查清单,让你可以在签约之前对候选的主机或托管供应商进行公证的评估——如果你的业务依赖于这些供应商的服务器、存储、网络等设施,你就更应该看看这份清单。这份清单也可以作为标准模板,用于评估你现在的运维状况,以及用作内部数据中心的新设计参考。
在你对设施的功能进行对比时,请记住,你评估的只是某个时间点的历史。随着需求和业务方向的改变,必须定期重新评估这些设施才能找到能跟上业务发展的配套设施解决方案。
你可以从这份数据中心审查清单作为基础,然后添加符合您自身行业或业务需求的条款。
审查计算设施
许多组织会与提供计算设施的数据中心供应商一起完成这些审查工作。其他应该参与审查的人包括在自主或租用数据中心负责设施选型、安装和维护的人员。
o审查计算设施与现有应用程序的兼容性
调查当前全套服务器、存储阵列、网络交换机和其他IT设备。汇总可用的计算资源,并验证相互之间的兼容性,并有足够的能力支持您现有的应用程序。
具有专门硬件要求的旧版或定制应用程序在托管服务器上可能会出现问题。每一种操作系统和虚拟机监控程序都可能出现兼容问题。请确认外包提供商是否会提供替代设备,或对您的IT组织已拥有的设备提供支持。
o审查快速设备更换计划和详细流程
当前的数据中心计算基础设施有多陈旧了?最近一次设备更换是什么时候发生的?什么时候才应该进行更换?打算引进哪些新设备?这些见解将引导制定服务器整合和工作负载平衡计划。
由于你的业务系统在数据中心服务商的设备上运行,服务方应该向你透明公开其技术刷新计划。
o优化设备更换流程
设备更换过程具备破坏性。所以,供应商必须多和用户沟通更新和升级计划,与用户一起合作,减轻因设备变化造成的工作影响。
在设备升级过程中,工作负载是否会维持运行?对于升级中无法避免的中断,是否有足够的沟通?你是否有这类中断的应对计划,例如提前备份或将工作负载临时迁移?
o有经验的本地职员和专家支持
多少IT专业人员能做到24X7随时待命(只要能遵循远程专家团队的指引完成操作,哪怕是最普通的工人也行)?如果数据中心人手不足或技术人员都不在现场而要临时调遣,中断事故会伤害关键应用。
有没有计划服务响应时间?升级路线是否在服务级别协议(SLA)中有清楚的约定?使用常用的电话呼叫来验证支持团队的响应时间和服务质量。
o管理和性能工具
如何衡量和监测系统的性能?如果你在应对外包供应商,你是否有机会获知全部或者部分以上信息?
托管公司通常不会透露整体环境数据,但如果你租用了他们的设备,请考虑通过一个web门户或应用程序性能监控管理(APM)工具来获取这些信息。你可能需要建立你自己的APM体系来确保SLA遵从性。
o高网络带宽
网络带宽信息应该在SLA中验证和通告。对于数据中心服务商来说,10Gbps网络带宽很常见。在对系统实时性能的监测中包括网络带宽指标。
你是否可以占用更多突发带宽,对应的费用会有多少?另一方面,你是否能通过限制带宽来控制成本,或者实现多站点的负载均衡,以免单个站点过载?
安全性和访问控制
物理篡改和盗窃行为会造成数据丢失,暴露公司机密。安全性降低的原因可能是数据中心运营方、IT部门,或者两者。
o物理安全
计算设施是否在数据中心安全稳固?可选的措施包括数据中心的单向入口,私有设备区域带锁的机柜——每个机柜都使用独立的物理或电子钥匙,对可以访问私有数据的区域上锁,例如电缆通道和配线架区域。
o访问文档
你能追踪雇员、承包商、供应商和访客的行为吗?请注意这些方法:签到表、全面的摄像监控记录、电子工牌或生物识别措施。
如果有任何人接触到你的设备,线缆通道、配线架,或者任何与你工作负载和数据相关的区域,是否有永久记录措施?尤其要重视多租户设施,因为一台服务器上的一名技术员的操作可能会影响多个客户端。
o内部安保人员
一些数据中心提供商的监控措施不仅限于摄像监控,还包括全职安保员工——甚至雇用武装警卫来执行对访客和供应商跟踪,便于数据中心实现24/7接待用户访问,并将安防信息与执法机构或其它安保线路接口。
o保护设备和数据
存储组件下线或变更用途很容易导致数据泄露。对于旧的、过时的或坏掉的磁盘,是否有妥善的保管或销毁措施?当磁盘从本地服务器或存储阵列中移除时是否有跟踪登记和安全地保管?谁负责销毁磁盘,如果外包合作伙伴负责处理,他们是否能提供书面的证明文件?
设施规划
数据中心提供的是长期和可靠的服务,合格的建筑设施甚至可以让你在将来都不用为设施管理而操心。
o安全的位置
选择一个数据中心的过程就是选择地址。该建筑应远离常见的环境灾害区域,例如泛洪平原和地震带。还应该避免靠近人为的危险区域,比如工业中心——炼油厂或化工厂,机场的主要航道线上,高速公路主要立交桥或铁道。
o便捷的运输安装
评估能加快装备部署和更换的任何措施。例如,室内的装运/接收码头可以让工人在搬运和放下IT设施时不会让这些设备遭受雨雪侵害。
如果数据中心是多层建筑,则电梯应该靠近卸货点。数据中心的货物安全通道应该足够宽大,容纳超大的设备,如包含机架冷却单元的全高机柜。设置访问中转点或老化测试区域也会非常有用,设备在转移到生产环境之前可以在这里完成预装和测试。
o办公设施
如果你支持工作人员现场办公,请确保该设施有一些专门的办公室、食堂或其它远离服务器设备高温和风扇噪声的人性化空间来用于工作。浴室或附近的酒店有利于员工在远程数据中心设施内安心加班。
o环境控制和安全功能
调查该建筑物是否具备先进的烟感探测措施,以及基于干粉灭火器的灭火措施。该设施应使用现代化的电气接地标准,如聚苯胺接地,以确保安全。
因为许多设施用水作为冷媒(例如冷水机组或换热器),综合泄漏检测是至关重要的。
o足够的电力和可恢复性
随着能源日益昂贵和稀缺,并非每个区域都会有充足的电力供应。将数据中心位置选在能源相对廉价和丰富的地方,因为能源短缺的地区也会有更高的电力成本。
寻找第二家供电网提供商,通过独立的变电站为设施供电,使用发动机提供后备电源功能,或者让数据中心邻近类似风电场的替代电源中心。如果使用工业级的不间断燃料电池发电机,例如Bloom Energy电池阵列,就需要让数据中心靠近天然气或其它沼气源。
o可靠的冷却
数据中心通常使用各种常规机械空调和冷冻水热交换器实现制冷,但冷却系统的短暂停机就会造成运营上的重大损失。请验证冷却单元有冗余备份机组,并且备份机组使用的是冗余电源。
冷却能力还应能够适应未来的增长。湿度控制系统必须兼顾人员舒适和电子设备的安全,维持恰当的湿度水平。
o标准法规遵从性
验证你遵从你所在行业的数据中心强制标准,并且有相关的文档和认证。涉及到数据中心的标准包括 SAS 70 II和 PCI DSS。
o网络连通性和运营商
找出哪些运营商已连接到数据中心,例如考克斯,AT&T,Verizon和其他地域性公司。一个中立的托管或托管服务提供商应支持多个地区的运营商和线路以实现冗余,每条线路都使用独立的连接,通过不同的光缆接入数据中心机房。