您现在的位置是:首页 > 对话CIO >

北京联合大学刘东:高校数据中心存储系统建设

2012-08-23 16:44:03作者:来源:

摘要高校数据资源中心是一个聚集了大量服务器、存储设备、网络设备等IT设备的场所,是高校的业务系统与数据资源进行集中、集成、共享、分析的场地、工具、流程等的有机组合。 ...

  高校数据资源中心是一个聚集了大量服务器、存储设备、网络设备等IT设备的场所,是高校的业务系统与数据资源进行集中、集成、共享、分析的场地、工具、流程等的有机组合。

  存储系统作为数据中心的最核的部分,围绕数据信息提供信息保存、信息备份、信息安全以及信息生命周期管理支持。对关键数据的存储和备份已成为数据中心运维的关键。目前,很多高校的数据中心都呈现出多样性的数据环境:一是应用类型的多样性,除了传统的以数据库为典型代表的结构化数据之外,大量的教学视频、图片、影音文件、设计文件等非结构化数据呈爆炸式增长;二是系统平台多样性,如UNIX、Linux、Windows等多种平台的使用方法都不尽相同;三是存储结构的多样性,因为数据中心发展历程和时间的延续,不同时期的不尽相同的应用导致了多种存储方式并存的现象,很多高校同时具有DAS、NAS、SAN等多种存储结构。

  因此针对这些问题,高校应构建统一的存储系统,实现对数据、策略、流程、存储资源和存储体系架构的统一管理,并保证数据的安全。总体设汁思路是采用“面向业务的体系架构”(Service—Oriented Arehileelure,SOA)的设计理念,以高校信息应用为依据,提供高融合、高性能、高可用性、高扩展性和高安全性的存储基础架构。

  (1)统一的存储架构

  统一存储指的是一种网络存储架构,它既支持基于文件的NAS存储,又支持基于块的SAN存储。这种多协议系统可以通过IP或光纤通道(FC)连接至服务器。在统一存储系统中,块访问通过光纤通道、SAS或基于以太网的iSCSI等接口来实现;文件访问是通过基于以太网的CIFS或NFS访问存储系统中的文件系统。

  统一存储架构包括以下几部分构成,系统架构如图所示:

  a. SAN盘阵,支持FC接口及IP接口,要造型时要选择高可用、高可靠且具备高扩展能力的高性能存储,支持自动分级及精简配置。

  b. NAS集群网关设备,支持CIFS、NFS等主流协议。

  目前已有与SAN盘阵集成在一起的一体化设备,在管理上较传统的NAS和SAN管理和资源调度上要方便快捷的多。

  

 

  (2)完善的备份体系

  数据备份工作是高校数据中心不可缺少的一项重要工作,一个良好的数据备份体系应该是规范而高效的,这需要部署可靠的备份系统及针对不同的情况而有效的制订备份策略。

  a. 备份系统的选择:

  一套完整的备份系统包括硬件及软件,高校的数据中心要根据网络环境而构建备份系统。目前市场上很多种备份设备可供选择,有基于磁带的备份设备,也有基于硬盘的备份设备。因此在架构时有D2T(磁盘-磁带)、D2D(磁盘-磁盘)以及D2D2T(磁盘-磁盘-磁带)等方式。单纯的D2T方式由于效率低下已不适用现在的高校数据中心中,D2D方式将是未来主流,而D2D2T符合分级存储的理念,在成本控制上是不错的选择。

  在备份软件方面,根据数据中心的网络环境要选择支持SAN环境(LAN free或Server free)以及虚拟化环境支持的备份软件,目前主流的备份厂商均支持SAN环境备份以及对虚拟化环境的备份支持。由于备份数据将是无尽的海量数据,因此数据去重功能是备份系统将要具有的特性,在备份系统选择时要着重考虑。

  b. 数据备份策略:

  如何选择和组合备份方式,是备份策略中最重要的问题之一。较为常见的备份方式是完全备份、增量备份和差异备份。完全备份是一种每次都对备份目标执行完整备份的方式;增量备份只备份上次备分(完全备份或增量备份)后增加或修改的部分,每次备份都基于上次备份进行。而差异备份是基于上一次完全备份的数据来备份两次之间改变的部分。单纯的采用任何一种方式都会存在一些缺陷。完全备份执行得过于频繁会消耗大量的服务器资源及备份存储资源。仅利用差异备份和增量备份在数据恢复时会存在一定风险,降低数据备份的安全性。因此最佳的备份方案是几种备份方式的组合,对不同应用采用不同的组合方式,这样能够对数据形成更好的保护方式。

  高校数据中心在建设时应重视灾难意识,需规划完善的灾备体系,确保意外发生时能通过灾备体系将业务恢复。

  (3)灾备技术手段

  各类灾备技术手段的选择主要取决于信息系统本身的组成和建设需求。目前灾备技术手段有主机型、存储型和虚拟化方式。

  (4)灾备体系建设

  灾备体系建设包含灾备中心建设及灾备网络建设。对于灾备网络,有条件的学校可以搭建物理专网,也可以依托校园网建立虚拟专网。对于灾备中心,独立校区的高校可以在一个校区的多个楼宇内建设,多校区高校也可以在不同校区的多个机房建设。

  清华大学数据中心是数字校园的枢纽和核心,由主数据中心和三个分数据中心构成,分布在校内不同楼宇中,目前主数据中心有运行数据3TB,备份数据12TB,容灾数据8TB。通过综合采用高可用技术,数据中心实现了信息系统运行环境无单点故障,信息系统整体达到了7×24小时的不间断运行的目标。

  北京联合大学则利用校区分散的条件,建设了存储异地灾备体系。校本部中心机房部署主存储,综合楼机房部署分中心存储,相隔近10公里外的师范学院部署灾备存储。主存储和分中心存储之间通FC链路进行连接,中心机房的磁盘阵列可以实时的自动将更新后的数据传送至综合楼机房的阵列中,以保持两台磁盘阵列中的数据完全一致。师范学院校区和校本部的数据灾备基于VPN链路,可基于VPN实现从校总部主存储上的数据异步灾备。当生产站点由于灾难导致整个业务系统瘫痪时,灾备站点的业务系统能够完全接管全部工作,在较短时间内恢复业务系统的运行。

  灾备系统部署及灾备数据传输链路如图所示:

  

 

(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们