您现在的位置是:首页 > IT基础架构 > 计算存储 >

磁盘数据在线无缝备份系统的设计与实现

2012-05-21 18:50:00作者: 来源:

摘要简述了磁盘数据在线无缝备份系统的特征有优越性,并详细描述了该系统的设计与实现。...

 引言

    随着信息化建设的发展以及各行业信息化应用的逐渐成熟,围绕信息化应用产生的各种技术也越来越多,其中涉及数据安全、备份和恢复领域的技术成为炙手可热的话题。在各种业务系统中,数据的地位越来越高,数据的丢失往往给个人和公司及单位带来不可估量的损失,数据安全性和可用性变的尤为重要。

 1磁盘数据在线无缝备份系统的特点

    数据备份是为数据提供安全保障的重要手段,传统的数据备份的工作原理:在数据发生故障前备份数据,等到数据发生故障再将备份数据还原到某一时间点。

    从备份时间上分类,备份有离线备份和在线备份;从备份策略选择上分类,备份有完全备份,增量备份、差异备份、累加备份。

    本文中描述的磁盘数据在线无缝备份系统具有如下三大特点:

    1)本备份系统属于在线备份,备份是实时进行的,即当原始数据有任何改动,备份数据实时做同步变动。本备份系统的实时备份和原始数据正常提供业务支持可以同时进行,并能严格保持数据原始数据和备用数据的一致性。

    2)本备份系统中设置有限速功能,依托此功能,实时监测当前系统的IO压力,设定迁移速度,尽可能减少备份对原始数据响应业务的能力,使得原始数据支持的业务系统能够正常运作,用户不会明显感觉到数据备份系统对原始数据响应业务请求的速度。

    3)本备份系统与原始备份系统最重要的区别在于数据恢复上。原始的备份系统采取的策略是:在原始数据发生故障时,用备份数据将数据恢复到某一个时间点,采用持续数据保护技术的系统也可以将数据恢复到任意时间点。这些备份系统的恢复都必须占用一段时间的数据恢复窗口。而本系统当监测到原始数据发生故障时,完全不需要恢复窗口,即原始数据发生故障时,备份数据能立刻响应业务请求。本系统只所以能够实现0时间恢复窗口,是由于采用了重定向数据流到备份数据的方式替代了原始的恢复数据的方式。这种特性对中断业务响应敏感的部门显得尤为重要。

 2系统的设计

    本系统采用模块化设计思想分为四个模块:信息中转模块,数据备份模块,限速控制模块,系统管理模块。

    2.1信息中转模块的设计

    信息中转模块的主要部分是监控其他各模块网络接口的守护进程。信息中转模块负责本系统中各模块的信息交换,包括实时监测原始数据的存储状况,监测原始数据的大小和变动情况,查询备份数据所在磁盘的剩余空间,接受限速控制模块查询的原始数据服务业务请求的压力大小,并将需要设置的新速率参数传递给限速控制模块。信息中转模块的功能还包括将其他各个模块中的重要参数传递给管理模块,并返回管理模块下达的各种指令。概括地说,信息中转模块就好比一个信息中转站,负责其他三个模块之间的信息传递。信息中转模块和其他模块的关系如图1所示。

 

    图1模块关系示意图

    2.2数据备份模块的设计

    数据备份模块是整个备份系统的核心模块,数据备份模块主要包括四个功能:

    1)负责数据实时备份,构造数据备份需要的IO请求,将构造的IO请求模拟成普通的Io请求发送给操作系统做统一处理。在系统刚刚部署,原始数据大部分还没有和备用设备上的备用数据同步前,这是的数据备份需要准确记录备份过的数据和目前备份进程中的位置。

    2)数据备份模块负责原始数据和备用数据的一致性。为了达到一致,在模块中巧妙地应用了截获系统IO请求,按IO请求类型做分类处理的方式。在本模块中构造一个字符设备,截获系统的全部IO请求,当原始数据可用时,如果为读请求,直接讲读请求原因下发给原始数据所在的存储盘,如果为写请求,需要克隆IO请求,原来的写请求变为两个IO请求,其中一个原样下发给原始数据所在的存储盘,另一个重定向到备份数据所在的存储设备;当原始数据发生数据不可用时,将截获的所有IO请求(不论读写)全部重定向到备份数据所在的存储盘。

    3)调节备份的速度。为了不过多影响原始数据对业务响应的速度,需要依据速度控制模块发送过来的速度指标调节备份的速度,在这里,速度控制模块相当于指挥者,备份模块相当于实施者,两者紧密合作使得用户几乎感觉不到备份的存在。调节备份速度的功能住系统部署初期和业务请求密集度高的时候至关重要。

    4)虚拟化存储磁盘。所谓虚拟存储,就是把多个存储介质模块(如硬盘、RAID)通过一定的手段集中管理起来,所有的存储模块在一个存储池(Storage P00l)中得到统一管理,从主机和工作站的角度,看到就不是多个硬盘,而是一个分区或者卷,就好象是一个超大容量(如IT以上)的硬盘。这种可以将多种、多个存储设备统一管理起来,为使用者提供大容量、高数据传输性能的存储系统,就称之为虚拟存储。这里所说的虚拟化存储磁盘的主要功能是借助虚拟化技术,避免用户直接使用机器的物理的磁盘,而是使用虚拟化层提供的虚拟化磁盘,为数据备份及恢复过程的无缝实施提供虚拟存储层的支持。为原始数据所在的每块物理磁盘虚拟一个虚拟盘,并在虚拟盘和物理磁盘之间确立对应关系。当原始数据发送故障时,所有的读写IO请求都重定向到备份数据所在的存储设备,使得备份系统无缝满足业务响应。实现无缝的前提必须是:即使源数据所在的设备发送故障,用户看到的却是完好的,否则业务无法下发请求。这里就用到了虚拟化存储磁盘的技术,在真正的物理磁盘上面添加虚拟的磁盘设备,真正的物理磁盘对用户隐形,只有虚拟磁盘对用户可见。所有的10请求都是首先下发到虚拟磁盘设备,再决定虚拟磁盘设备接收到IO请求时发送到源数据所在的磁盘还是备份数据所在的磁盘。这种使用虚拟磁盘的方式让无缝备份让用户透明。

    在系统实现上关于处理截获的IO请求的核心函数如下:

   

  

    2.3限速控制模块的设计

    限速控制模块主要包含两项功能:

    1)检测源数据所在存储设备和备份数据所在存储设备的状态。将检测到的状态通过消息中转模块发送到备份模块,备份模块依据此信息决定截获到的IO请求该如果处理。

    2)监控业务对虚拟磁盘下发的IO请求密集度和备份模块构造的lO请求密集度。由这两个密度值查找预设的速度控制查找表,将找到的速度控制参数通过消息中转模块发送到备份模块,备份模块据此实时挑战备份的速度。速度控制查找表相当于无缝备份系统中的速度控制策略库,查找表的各项预设参数值可以形成各种速度控制策略。

    2.4系统管理模块的设计

    系统管理模块在整个系统中充当备份系统管理员与备份系统交互的窗口。系统管理是以web界面的形式呈现给用户的,系统管理模块从其他几个模块中收集系统状态信息供用户查看,包括备份进度,备份速率,虚拟磁盘列表。物理磁盘列表,虚拟磁盘与物理磁盘的映射关系,源数据所在磁盘的状态,备份数据所在磁盘的状态。管理员对系统的管理就是通过系统管理模块给备份系统下达各种命令。例如管理员认为当前速率控制参数设置的不合适,可以通过速率控制参数配置界面重新设置速度控制查找表中的参数值。设置完成后,点击确定,新设置的参数值通过信息中转模块发送给限速控制模块,限速控制模块依据消息中的值更新速度控制查找表。

 3系统部署及系统初始化过程

    检测服务器上为何种类型的操作系统,对比安装说明书,确保服务器上的操作系统与在线无缝备份系统兼容,配置web服务,发布web网页,用安装脚本加载消息中转模块,数据备份模块,限速控制模块即可使用。

    加载完成后,系统扫描服务器上所有可用的物理磁盘,和磁盘状态信息,并将这些信息保存到系统加载时生成的配置文件中。管理员在web界面上依据这些信息指定那些物理磁盘用来存放源数据,那些物理磁盘用来存放备份数据。配置完成后系统已经管理员的配置信息自动生成普通屹务程序可见的虚拟磁盘,虚拟磁盘自动和物理磁盘建立好映射关系。如果系统管理员不重新配置满足自己特定需求的迁移速率,那么系统将采用默认的迁移速率参数值。自此磁盘数据在线无缝备份系统可以正常使用了。

 4结论

    本系统基于无缝的特点将在业务中断敏感的存储领域发挥不可替代的作用,让业务在源数据存储磁盘损坏的情况下一样正常运行,在保证数据安全性的同时大大增加了数据的可用性。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们