当前位置 :首页 > 新闻中心
企事业单位数据中心机房搬迁策略
* 来源 : * 作者 : * 发表时间 : 2015-12-16 * 浏览 : 23

搬迁实施方案必须贴近实际,在内容上周密细致、切实可行,其中重点是如何保障网络迁移的平滑。

  随着近些年信息化建设步伐的加快,旧的机房已逐渐无法适应现代化的信息化应用和管理,新建容灾机房,改造旧机房等新需求正变为现实。相对来说,在经费充足的情况下,新建或改造一座机房并不是那么困难,如何搬机房才是真正的难点。我们或许考虑过两座机房该如何容灾,考虑过业务系统如何高可用,考虑过单点故障时有哪些可应急的方案,但是,当我们要搬移这些网络和计算设备时,之前的所有考虑都还能管用么?

  毫无疑问,机房的搬迁工作是一项复杂的工程,不仅要把网络、计算、存储等各类生产设备安全迁移到新机房,而且要求网络系统的迁移和集中存储系统的迁移必须安全、平稳,甚至达到不停机,不影响业务系统应用的要求。基于此,机房搬迁的风险点更加难以控制,技术难点也比初始部署或技术改造更为繁琐。

  虽然高校的业务还尚未达到极致的24小时×7天的连续性需求,但保证业务连续性仍然是数据中心搬迁过程最核心的要求,网络保障则是机房搬迁成败的关键。

  中南民族大学原有旧机房建于1999年,面积约70平方米,在配电、空调制冷、机柜容量、洁净度等方面已远远落后于当前信息化发展水平。经过“十二五”期间的数字化校园建设,逐渐改造或新建了边界网络、核心网络、数据中心网络、数据中心计算资源池等关键基础设施。在学校的大力支持下,于2014年末立项新建了两座机房,分别位于校内相隔1千米的两座建筑物内,功能上分为容灾机房和新的主机房,每座机房面积约120平方米,至2015年两座机房分别竣工,将旧机房设备和业务分别迁移到两座新机房,最后拆除旧机房。

  按照机房和数字化校园的建设规划,网络、计算、存储等主体架构设施都是双活设计,双活的实现也成为本次搬迁可利用的技术要点和有利条件,它使搬迁具备了不停机、不断网的可能。

理清搬迁思路

  总体来说,本次搬迁规划分为两个阶段:第一个阶段为旧机房搬迁到容灾机房,使容灾机房具备完全独立承载全校网络和业务的能力;第二个阶段为旧机房断电,剩余全部设备搬迁到主机房并与容灾机房一起双活运行。整个搬迁过程按照不断网,不停业务的高标准进行组织安排,工期安排在暑假进行。图1所示为校园总体网络拓扑结构。

  网络方面,自无线控制器,核心交换机、认证BRAS、防火墙,到边界交换机均以IEEE802.3ad协议实现双设备双活配置连接,所需做的重点是梳理线路连接,确保分拆到两座机房后立即正确接好心跳线,避免脑裂导致的网络异常,之后逐条接好汇聚到核心的双上行链路,确保双上行链路在割接过程中至少有一条不断开,用户不会感知到网络中断。数据中心的计算资源方面,已有两套刀片服务器,绝大多数关键应用和服务都创建在两套刀片组成的一个虚拟化集群内,在两个搬迁阶段中分别将全部业务漂移到一组不搬的计算环境就能确保业务不断条件下的搬迁实施。存储方面,已在2014年末采购了双活存储网关,一直等待新机房完工,图1所示的存储拓扑为搬迁完后规划的存储拓扑。双活存储网关和一套新存储在搬迁过程中部署在容灾机房,先与旧机房存储做好双活同步,使新旧两套存储都具有完整的数据,再将搬到容灾机房的刀片服务器、新存储、双活存储网关接通,使容灾机房的服务器与存储能全部接管全部业务,达到旧机房存储停机条件,将旧机房存储搬迁到新主机房,从而保障业务运行的同时也兼顾了存储的搬迁工作。除此之外,还剩余一些非关键业务的服务器或交换机,则在需要搬迁时短暂停机。

  根据上述搬迁思路规划,不仅可以在实践中检验双活架构真正做到业务和网络不中断的效果,还有额外的优势在于:第一,所有的搬迁和割接工作都可安排在白天进行,实施人员可在头脑清醒的状态下投入工作,降低人为误操作的机率;第二,由于是不间断网络和业务的搬迁,所以不存在搬迁的窗口时间,实施过程的时间压力减小很多,尤其对于机器设备存在搬动后硬件故障的可能,更是无法掌握的时间因素;第三,割接过程万一出现预料之外的差错,用户会在最短的时间反馈给实施人员,以便及时调整和解决,若在夜间进行搬迁和割接因无法得到用户反馈,即使准备了相应的验证条件,也可能获得有偏差的结果,到白天又付出更多回退和中断事件才能找到症结。

  搬迁的风险是客观存在的,总体上也有三个方面。技术方面,虽然有高可用性技术作为支撑,但仍可能存在意料之外的问题,因此必须制定一些策略,将业务对技术所依赖的各个方面都考虑进来,在搬迁前进行验证性测试和检查,以缩短万一出现的停机时间。硬件迁移方面,很多设备可能都会导致搬运过程中遭到损坏,策略之一是提前联系好供货商,在质保期内还可及时提供备件的更换,策略之二则是对该硬件承载的功能提前做出预判和备用,确保损坏真的发生时能减少损失。数据方面,不停机的搬迁在数据层面一直是活动的,提前的备份并不能持续跟踪变化的数据存储,但备份仍然是不可缺少的,我们可以采取业务系统只读等措施来减少搬迁期间的数据变化,以兼顾网络服务的持续使用和数据可恢复能力。