TSM的异地容灾解决方案

灾难恢复流程建议 4.7.1 TSM备份系统的离线介质管理 XXX本次备份方案,不仅涉及到生产中心的数据本地备份,还应该考虑备份数据的离线保存,和部分生产中心数据到容灾中心的异地传…

灾难恢复流程建议

4.7.1 TSM备份系统的离线介质管理

XXX本次备份方案,不仅涉及到生产中心的数据本地备份,还应该考虑备份数据的离线保存,和部分生产中心数据到容灾中心的异地传输;

为了保证备份数据的可靠性,我们建议对生产中心重要数据备份的磁带介质进行复制,一份用于近线保存,另一份用于离线数据保护(建议将此份磁带保存在灾备中心,可用于数据的异地恢复)。TSM能够生成备份数据的多个副本,并支持对离线介质的管理,如下图所示:

TSM能够自动进行存储磁带介质的管理,对于离线的磁带,TSM能够自动跟踪其状态,如从磁带库到离线位置,TSM的DRM模块还能够自动进行离线磁带上的数据过期与淘汰,自动标示那些离线磁带可以被回收利用等。这些技术充分简化了离线磁带的管理。

TSM是建立在关系型数据库上的企业级数据备份管理软件。Tivoli灾难恢复管理器创建并使用数据库信息,从而管理灾难恢复的准备过程。TSM的DRM模块(灾难恢复管理器)加强了TSM备份系统。

TSM的DRM模块不仅通过将数据异地保存来保护企业的数据,而且能跟踪所有在线和离线的磁带,并可以自动识别哪盘磁带离线。自动产生的灾难恢复计划也能自动的每日更新。通过这个自动产生的灾难恢复计划,我们可以以最小的工作量在异地或本地重建我们的应用系统,这意味着,TSM的DRM模块将不仅包括通常的意义上的灾难恢复计划,还包括前瞻性的业务持续性发展计划,可以对企业的应用提供多重的灾难恢复模式。

4.7.2 TSM备份系统故障保护与恢复

TSM备份系统与其他的业务系统一样,也需要进行充分的保护,以备发生故障时有效的进行数据恢复,充分保证数据的可靠性和安全性;

TSM备份系统的保护主要有以下手段:

1. TSM服务器采用HA双机技术,当其中一台服务器停止工作的时候,另外一台服务器能够顺利接管,保证备份和恢复任务不中断;

2. 采用镜像技术和备份技术保护TSM系统的索引信息数据库,可以将TSM的内置数据库卷镜像到其他的硬盘空间,还可以将其通过NFS镜像到其他机器的存储空间,从而充分保证索引数据库的可用性;此外,我们还建议通过备份技术每天对TSM系统的索引信息数据库进行备份,可以备份至一盘或一组独立的磁带上,并定时做离线,从而充分保证索引数据库的可靠性;

3. 通过拷贝存储池技术来对备份的业务数据进行额外保护,并定期做离线,当灾难发生时,能够有效恢复;

当TSM系统由于意外而需要重建时,我们可以按以下步骤处理:

1. 如果TSM Sever建立在HA的环境下(即TSM Server分别安装在HA的双机上,而数据库文件则建立在共享的盘阵上),一旦TSM Server瘫痪,将由Standby TSM Server自动接管。

2. 如果在配置TSM Server中,已经将其后台数据库作了MIRROR配置,则只需将MIRROR的数据库文件直接激活即可。

3. 如果对其后台数据库作了及时的本地备份,利用数据库的恢复功能恢复本地数据库,直接恢复TSM Server。

4.7.3 基于TSM的数据容灾方案

为了充分保护数据的安全性,我们建议将重要的业务数据不仅备份到本地的磁带库,还应该复制一份用于离线,离线的磁带应该由TSM系统进行有效跟踪管理;此外,我们还建议由TSM系统负责将一些没有同步到容灾中心的数据定期复制到容灾中心,以备灾难发生的时候进行快速恢复;

因此,我们在此建议使用TSM磁带离线管理和TSM远程数据传输管理两个重要的技术构建数据级的数据容灾方案。

使用DRM模块进行离线磁带管理

关于TSM的离线磁带管理,我们在前面章节已经专门阐述,基本思想是采用TSM的灾难恢复模块DRM进行集中管理;

TSM的DRM模块用于对TSM系统进行自动化的保护,在灾难恢复时进行系统的快速自动恢复。DRM的核心功能是自动生成并更新灾难恢复计划,自动跟踪离线磁带的状态,进行磁带介质的自动管理,自动化TSM服务器的恢复管理。具体功能如下图所示:

针对XXX的具体需求,我们建议在生产中心集中数据备份的基础上,由TSM系统定期生成离线磁带,定期做磁带离线,当灾难发生时,有效进行数据恢复;

TSM远程数据传输方案

针对那些没有同步到容灾中心的重要业务系统数据,我们建议采用TSM的远程数据传输功能进行数据级容灾复制;TSM提供两种远程备份容灾机制,一种是基于网络和移动介质的导出和导入机制,另外一种是远程备份技术;我们将分别阐述这两种技术,并根据XXX具体的网络条件和要求选用相应的技术。

Server-To-Server数据复制技术:该技术能够将生产中心TSM备份系统的所有或部分数据导出,并可传输到另一服务器(导入)。有两种方法可用来执行导出和导入操作:

  • 直接导出到网络上另一TSM服务器,即容灾中心的TSM系统。这种方式不需要在两个TSM服务器间有兼容的顺序设备类型就能立即进行数据传输。
  • 导出到顺序介质,然后使用此介质将数据导入到具有兼容设备类型的另一个TSM服务器。

使用TSM的远程Server-To-Server容灾复制功能,我们能够通过下列一个或多个导出命令将全部服务器控制信息或其子集导出: 

EXPORT ADMIN 

EXPORT NODE 

EXPORT POLICY 

EXPORT SERVER

将数据导出到目标服务器时,需要指定将接收导入TSM操作数据的服务器名称。TSM的远程复制功能支持增量复制,系统管理员可限制在指定的日期与时间或在此之后导出到存储在服务器上的对象的文件数据。可使用 FROMDATE 和 FROMTIME 参数,基于文件原来存储在服务器中的日期与时间来导出数据。FROMDATE 和 FROMTIME 参数仅适用于客户机用户文件数据;这些参数不影响其它已导出的信息,例如策略。

远程备份技术:TSM同时提供远程备份技术,TSM技术架构的灵活性使我们能够使用一个TSM客户端将数据备份到不同的TSM服务器,因此,我们可以将需要远程容灾备份的数据首先备份到生产中心的TSM系统,然后通过广域网远程备份到容灾中心的TSM系统,容灾中心的业务系统可以通过TSM客户端直接从本地的TSM系统进行数据恢复;

考虑到XXX的具体需求,我们建议根据需要远程传输的数据量和网络带宽选择合适的方式,如果需要传输的数据量较大,而带宽较小,则采用先在生产中心将数据导出到磁带,然后再从磁带导入容灾中心的TSM系统的方式;反之,如果需要传输的数据量较小,则可以采用Server-To-Server的传输方式,或者采用远程备份技术从生产中心的TSM系统直接将数据复制到容灾中心的TSM系统中去。

从TSM V5.5开始,TSM系统对Server-To-Server也支持断点续传的功能,因此更大限度的降低了对容灾网络的要求。

4.7.4 基于TSM的数据恢复流程

当发生大规模灾害,导致本地IT系统崩溃时,启动异地数据恢复。由于XXX的生产中心数据都已经复制到了容灾中心,所以当生产中心由于灾难而不可访问时,可以切换应用到容灾中心;而只有在容灾中心发生灾难时,才会考虑采用TSM的最后恢复方案;

TSM的灾难恢复方案,主要是使用生产系统备份的离线磁带,在灾备中心恢复生产中心备份系统DB和recovery log,再将备份数据异机恢复到灾备中心环境中。TSM具备灾难恢复模块,Tivoli Disaster Recovery Manager,该模块能够帮助管理人员实现数据恢复计划的建立和实施。包括实现TSM系统和应用系统的自动重建。通过DRM的实时的灾难恢复计划,有效的管理各种在线和离线的存储介质,为应用系统的恢复提供强有力的保障。无须系统管理人员在大量的磁带中寻找合适的磁带进行应用系统的恢复。并且,灾难恢复计划是一个非常实用的灾难恢复流程顾问工具,通过DRM,不仅可以自动的恢复TSM系统和应用系统的数据,而且,可以帮助用户进行存储管理流程的建立和优化,实现规范化的存储管理。

具体来讲,当数据需要灾难恢复时,我们建议按照以下流程处理:

  1. 为灾难恢复准备TSM服务器;
  2. 通过DRM模块,恢复生产中心备份服务器(包括DB和recovery log);
  3. 重建应用系统并通过TSM快速恢复至上一次备份状态;
  4. 通过TSM Client恢复文件系统;Windows系统直接恢复到目标服务器;SCO UNIX系统先恢复到临时服务器,通过NFS方式将文件恢复到SCO UNIX系统
  5. 恢复数据库,SAP等系统的应用数据;直接通过DB2自带的TSM备份接口恢复数据库;
  6. 重新启动数据库,验证数据库数据的可用性

作者: admin

为您推荐

发表评论

返回顶部