存储备份基本知识
第 1 章
1.1
基础知识 ......................................................................................................4
备份 .............................................................................................................................. 4 1.1.1 1.1.2 1.1.3 1.1.4
什么是备份 ....................................................................................................... 4 相对于手工备份的优势 ................................................................................... 5 备份和恢复 ....................................................................................................... 6 备份结构 ......................................................................................................... 10
1.1.4.1 Host-Based备份方式: .............................................................................. 10 1.1.4.2 LAN-Based备份方式: ............................................................................. 10 1.1.4.3 LAN-Free备份方式: ................................................................................ 11 1.1.4.4 Server-Free备份方式 ................................................................................. 12 1.1.5
备份分类 ......................................................................................................... 13 全备份 ........................................................................................................ 14 增量备份 .................................................................................................... 14 差异备份 .................................................................................................... 14 辅助副本 .................................................................................................... 14 合成全备份 ................................................................................................ 14 各备份类型的优缺点 ................................................................................ 15
1.1.5.1 1.1.5.2 1.1.5.3 1.1.5.4 1.1.5.5 1.1.5.6 1.1.6 1.1.7 1.2
1.2.1 1.2.2
备份技术的评判标准 ..................................................................................... 16 归档和迁移 ..................................................................................................... 18 RPO同RTO ................................................................................................... 18 容灾的级别 ..................................................................................................... 19 国际Share78标准 ..................................................................................... 23
容灾技术 .................................................................................................................... 18
1.2.2.1 《信息系统灾难恢复规范》(GB/T 20988-2007 ) ............................... 19 1.2.2.2 1.2.3 1.2.4
备份同容灾 ..................................................................................................... 25 复制技术 ......................................................................................................... 27 同步复制 .................................................................................................... 27 异步复制 .................................................................................................... 27
1.2.4.1 1.2.4.2 1.3
1.3.1
备份设备简介 ............................................................................................................ 27
磁带设备 ......................................................................................................... 27
存储容量 ................................................................................................. 27 压缩后存储容量 ........................................................................................ 28 持续传输率 ................................................................................................ 28 压缩后传输率 ............................................................................................ 28 磁带尺寸 .................................................................................................... 29
1.3.1.1 1.3.1.2 1.3.1.3 1.3.1.4 1.3.1.6
1.3.1.5 MTBF .......................................................................................................... 29
1.3.1.7 1.3.1.8 1.3.2 1.3.3
存储技术 .................................................................................................... 30 装带方式 .................................................................................................... 32
D2D2T备份 .................................................................................................... 33 VTL ................................................................................................................. 34
CommVault-Galaxy备份系统基本原理
第 1 章 基础知识
1.1 备份
1.1.1 什么是备份
数据备份顾名思义,就是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。在日常生活中,我们经常需要为自己家的房门多配几把钥匙,为自己的爱车准备一个备胎,这些都是备份思想的体现。
数据备份作为存储领域的一个重要组成部分,其在存储系统中的地位和作用都是不容忽视的。对一个完整的IT系统而言,备份工作是其中必不可少的组成部分。其意义不仅在于防范意外事件的破坏,而且还是历史数据保存归档的最佳方式。换言之,即便系统正常工作,没有任何数据丢失或破坏发生,备份工作仍然具有非常大的意义,为我们进行历史数据查询、统计和分析,以及重要信息归档保存提供了可能。
简单的说,一份数据备份的作用,不仅仅像房门的备用钥匙一样,当原来的钥匙丢失或损坏了,才能派上用场。有时候,数据备份的作用,更像是我们为了留住美好时光而拍摄的照片,把暂时的状态永久的保存了下来,供我们分析和研究。当然我们不可能凭借一张儿时的照片就回到从前,在这一点上,数据备份就更显神奇,一个存储系统乃至整个网络系统,完全可以回到过去的某个时间状态,或者重新“克隆”一个指定时间状态的系统,只要在这个时间点上,我们有一个完整的系统数据备份。
还有一个需要澄清的问题,数据备份更多的是指数据从在线状态,剥离到离线状态的过程,这与服务器高可用集群技术以及远程容灾技术,在本质上有所区别。虽然从目的上讲,这些技术都是为了消除或减弱意外事件给系统带来的影响,但是,由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。集群和容灾技术的目的,是为了保证系统的可用性,也就是说,当意外发生时,系统所提供的服务和功能不会因此而间断。对数据而言,集群和容灾技术是保护系统的在线状态,保证数据可以随时被访问。而相对来说,备份技术的目的,是将整个系统的数据或状态保存下来,这
第 4 页
CommVault-Galaxy备份系统基本原理
种方式不仅可以挽回硬件设备坏损带来的损失,也可以挽回逻辑错误和人为恶意破坏的损失。
然而,一般来说,数据备份技术并不保证系统的实时可用性。也就是说,一旦意外发生,备份技术只保证数据可以恢复,但是恢复过程需要一定的时间,在此期间,系统是不可用的。在具有一定规模的系统中,备份技术、集群技术和容灾技术互相不可替代,并且稳定和谐的配合工作,共同保证着系统的正常运转。
1.1.2 相对于手工备份的优势
相比于系统、数据库管理人员手工备份,自动备份软件有如下的优势: 一、稳定性
备份的主要作用是为系统提供一个数据保护的方法,于是备份本身的稳定性和可靠性就变成了最重要的一个方面。相比与手工备份,自动备份软件更能保证备份的稳定可靠,能提供方法确保不会在恢复时才发现备份是不成功的。
二、全面性
在复杂的计算机网络环境中,可能会包括了各种操作平台,如各种厂家的 UNIX、Windows NT等,并安装了各种应用系统,如数据库、文件系统等。备份软件可以全面支持这些平台、软件。
三、自动化
很多公司由于工作性质,对何时备份、用多长时间备份都有一定的限制。在下班时间系统负荷轻,适于备份。可是这会增加系统管理员的负担,由于精神状态等原因,还会给备份安全带来潜在的隐患。自动备份软件能提供定时的自动备份,并利用磁带库等技术进行自动换带。在自动备份过程中,还有日志记录功能,并在出现异常情况时自动报警。
四、高性能
随着业务的不断发展,数据越来越多,更新越来越快,在休息时间来不及备份如此多的内容,在工作时间备份又会影响系统性能。备份软件在备份时,可以尽量考虑到提高数据备份的速度,如利用多个磁带机并行操作的方法、利用合成备份的方法等等。
五、操作简单,集中管理
第 5 页
CommVault-Galaxy备份系统基本原理
备份软件提供集中管理功能,能够对特别重要数据做多份拷贝,并能记录跟踪每次备份的不同版本,这样就可以按照需要恢复不同的数据。数据备份应用于不同领域,进行数据备份的操作人员也处于不同的层次。备份软件提供了一个直观的、操作简单的图形化用户界面,缩短操作人员的学习时间,减轻操作人员的工作压力,使备份、恢复工作得以轻松地设置和完成。
六、实时性
有些关键性的任务是要24小时不停机运行的,在备份的时候,有一些文件可能仍然处于打开的状态。那么在进行备份的时候,要采取措施,实时地查看文件大小、进行事务跟踪,以保证正确地备份系统中的所有文件。而这些仅凭借手工备份是很难做到的
七、能更迅速、准确的恢复数据
备份软件精确的知道每次备份发生的时间和内容以及存放地点,能够迅速找到并恢复数据。同时,也可以采用多种技术如从快照恢复、多流恢复等方法提高恢复速度。备份软件也能提供更小颗粒的恢复,如能支持Exchange单messenge恢复、AD小颗粒恢复等功能。
1.1.3 备份和恢复
数据备份的根本目的,是重新利用,这也就是说,备份工作的核心是恢复,一个无法恢复的备份,对任何系统来说都是毫无意义的。在实际情况中,厂商或集成商更多的是向用户吹嘘,自己的产品在备份过程中如何的巧妙。然而,作为最终用户,一定需要清醒的认识到,能够安全、方便而又高效的恢复数据,才是备份系统的真正生命所在。也许很多人会以为,既然备份系统已经把需要的数据备份下来了,恢复应该不成什么问题。这就大错而特错了,事实上,无论是在金融电信行业的数据中心,还是在普通的桌面级系统中,备份数据无法恢复,从而导致数据丢失的例子实在太多了。就在日前,我国西北地区的一个省级电信运营商还糟此劫难,系统数据遗失殆尽,该运营商的声誉和众多用户的利益都受到了重大损害。这次事故的主要责任者之一,就是一个全球知名的备份软件厂商,因为其提供的备份产品没能正常恢复系统数据。
众所周知,建造大楼时一定会配备消防系统,但是,并非有了消防系统就能高枕无忧。人们经常获悉,有的楼房突遭火灾时,消防系统却无故瘫痪了,或者消防栓里没有水,或者消防通道被堵塞,以致火势蔓延,造成巨大的生命财产损失。因此,并非所有的消防系统,在遭遇火灾时都能起作用。一样的道理,数据备份设施之于IT系统,就相当于消防系统之于楼房,它是保护IT
第 6 页
CommVault-Galaxy备份系统基本原理
系统的最后一道防线。即使配备了数据备份设施,并不表明在IT系统遇到问题时一定能将丢失的数据成功恢复。
为了进一步阐明恢复的重要性,让我们再来对比一下备份和恢复操作的区别。 一.备份是计划内的工作,而恢复则是计划外的工作。
对于IT技术人员来说,备份是按照既定的备份策略,每隔一定时间,按部就班地操作即可。而恢复,则是只有当发生数据丢失时,或者要查找历史数据时,才会进行的操作。通常情况下,实施恢复操作时,往往都是十万火急,越快越好,同时还希望恢复后的数据可用。
由于备份对系统的影响比较大,所以备份的工作往往是在特定的时间内完成的,也即所谓的“备份窗口”,这时生产系统通常不工作。而恢复,因为是计划外的工作,对生产系统肯定会产生影响。下面以电子邮件数据的备份和恢复为例,来说明恢复对系统的影响。
假定您对电子邮件系统的备份策略是每晚八点定时备份到磁带,备份完成后磁带里就会保存有昨天晚上八点之前收到的所有电子邮件。当然,收发电子邮件是一个连续的动作,晚上八点后,邮箱仍然在不停地收邮件。假设到了今天中午12点,您发现某一个重要的邮件不小心被删掉了,如果这个邮件是昨天晚上八点前收到的,那么您还是有可能从磁带里恢复该邮件。这时就要启动恢复操作了。
如果备份软件能够实现邮件一级的恢复(恢复颗粒是单个邮件)的话,您只要能找到那封丢失的邮件,直接将它恢复到邮箱就可以了,恢复的过程对整个邮件系统没有任何影响;但是,如果您的备份软件只能做到邮箱级的恢复(恢复颗粒是一个邮箱),那么如果您想恢复该邮件的话,就不得不把整个邮箱恢复到昨晚八时的状态,造成的后果就是昨天晚上八点到今天上午12点收进的邮件会全部被覆盖。可见,如果从备份的角度来说,两者没什么区别;但是从恢复的角度来讲,两者差别很大。
二. 备份是大批量的数据移动过程,往往需要将所有数据或所有增量数据全部拷贝到备份设备,而恢复往往是少量的数据移动过程,只需将需要恢复的数据从备份设备拷贝回主服务器。
现在市场上流行的很多备份软件,基本上都是在上世纪80年代设计的,那时的数据量相对较小(几十兆到几百兆)。当进行备份操作的时候,备份软件会把所需要备份的数据文件打包成一个备份集(backup set),然后将它拷贝至备份设备中,并且针对该备份集形成相对应的索引,但一般不会对备份集里的内容建立详细的索引。那么当需要恢复该备份集中的某一个文件时,备份软件就必须从备份集中搜索到该文件,然后进行恢复。这在只有几百兆数据量的IT环境下完全可行,然而来到我们目前所处的海量数据的时代,由于数据量已经高达几十甚至几百TB,如果继
第 7 页
CommVault-Galaxy备份系统基本原理
续沿用这种方式,势必产生许多问题:从浩如烟淼的备份数据里,找到并恢复您需要的那一个,难度无异于大海捞针!例如,有的用户去电信公司要求查询自己的历史话单(如两年前的某一个月的通话记录),今天,很多电信公司无法满足用户的这一需求,因为很多情况下明知该历史话单一定存在于原先的备份介质中,但由于数据量实在太大,几乎没有可操作性。这种情况下,备份虽然是成功的,但是恢复的成功率却很低。
META Group在2004年4月的一份题为“Proactive Data Protection”的调查揭示了数据恢复的真相:
1. 恢复作业的平均成功率只有70%左右;
2. 主要的恢复需求是恢复单个文件或单个表空间,而不是整个卷; 3. 而恢复单个文件至少要花1个小时, 有时甚至要接近1天。 所以,当考虑数据保护时,应着眼于“恢复”,需着重考虑以下几点: 1.确保数据能够恢复 2.恢复速度要尽量快
3.恢复操作对系统的影响要尽可能小 4.能够恢复到用户指定的时间点 5.恢复的数据是可以使用的
当然,恢复是在备份的基础上进行的,如果备份失败,恢复肯定不会成功。为了确保能达到恢复的目的,对备份操作有以下几点基本要求:
1.提高备份成功率
备份过程中,当备份介质、备份设备和网络出现问题时,备份作业就会中断,要提高备份的成功率,备份系统就应具有容错机制。如果是备份介质或备份设备出现问题,可以将备份自动切换到其他的备份介质、设备或路径上,并能确保从中断处继续备份操作。另外,“备份的断点续传”也很重要,当网络发生阻塞时,备份也会中断;一旦网络恢复正常,备份能从中断处自动重启并继续进行。
CommVault几乎所有的操作均支持”断点续传”,而且拥有”GridStor”功能,可以进行故障切换,极大的保证了备份成功率。
第 8 页
CommVault-Galaxy备份系统基本原理
2.精细的备份数据索引
当用户希望恢复数据时,绝大多数情况下并不需要恢复整个系统,而只要恢复部分数据,甚至只是一个文件或邮件。索引做得足够精细,有利于在恢复时能快速查找并定位所需要恢复的数据,实现小颗粒恢复,同时将对系统的影响降到最小,恢复速度大幅提高。
CommVault优秀的索引设计保证了能够快速定位单个文件或者邮件,并且能够实现业界最小颗粒的恢复,如能够进行Windows AD属性级别的恢复、能够恢复SharePoint、Notes的单个文档等。
3.能产生多个数据副本
为了防止备份数据意外损坏,产生多个备份副本是必要的,也很有效。产生数据副本的方法有两种:同步和异步。同步的方法是,在备份时,同时把备份数据写入到两个不同的介质中;异步的做法是,先把备份数据写入一个介质,然后再利用空闲时段,将备份数据复制到其他介质上。当然也可以通过网络将其复制到异地,达到数据容灾的目的。
CommVault提供了多样的写入拷贝策略,如Inline/AuxCopy等,可以方便的定制不同的保存期限,可以跨不同介质种类自由的拷贝。
4.离场保护
如果数据备份是为了恢复而进行的,就应该考虑到万一数据中心遭遇灾难时,怎样进行恢复。这时“离场保护”中保存的数据副本就会起到很大的作用。
CommVault提供VaultTrack选项,可以方便的管理“离场保护”。 5.操作界面应足够简单
用户界面应该面向恢复,而非面向备份。在面向数据恢复的用户界面,所有的备份数据是按照数据原先的结构来组织的,需要恢复哪个数据,很快就能找到,轻松点击一下就能恢复该数据了。
CommVault采用全图形化、无需脚本的管理,致力与软件的自动与智能,很大程度上可以实现自管理,极大的减轻了管理员的压力,使其可以更关注于本身的数据而不是备份软件。
综上所述,CommVault是一个真正有效的数据备份系统:以恢复为目的来设计数据保护系统,管理简便,能快速便捷地实现恢复。除此以外,正如前文提到的消防系统的事例,为了确保消防
第 9 页
CommVault-Galaxy备份系统基本原理
系统在遭遇火灾时能够正常工作,应该定期进行防灾演习,数据备份系统也应该经常做些数据恢复演习,确保在真正需要时,能够实现对数据的有效恢复。
1.1.4 备份结构
常见的数据备份系统主要有Host-Base、LAN-Base和基于SAN结构的LAN-Free、Server-Free等多种结构。
1.1.4.1 Host-Based备份方式: Host-Based是传统的数据备份的结构这种结构中磁带库直接接在服务器上,而且只为该服务器提供数据备份服务。在大多数情况下,这种备份大多是采用服务器上自带的磁带机,而备份操作往往也是通过手工操作的方式进行的。
Host-Based备份结构的优点是数据传输速度快,备份管理简单;缺点是不利于备份系统的共享,不适合于现在大型的数据备份要求。
1.1.4.2 LAN-Based备份方式: LAN-Based备份,在该系统中数据的传输是以网络为基础的。其中配置一台服务器作为备份服务器,由它负责整个系统的备份操作。磁带库则接在某台服务器上,在数据备份时备份对象把数据通过网络传输到磁带库中实现备份的。
LAN-Based备份结构的优点是节省投资、磁带库共享、集中备份管理;它的缺点是对网络传输压力大。
第 10 页
CommVault-Galaxy备份系统基本原理
1.1.4.3 LAN-Free备份方式: LAN-Free和Server-Free的备份系统是建立在SAN(存储区域网)的基础上的,其结构如下图所示。基于SAN的备份是一种彻底解决传统备份方式需要占用LAN带宽问题的解决方案。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,是一种无需占用网络带宽 (LAN-Free) 的解决方案。
目前随着SAN技术的不断进步,LAN-Free的结构已经相当成熟,而Server-Free的备份结构则不太成熟。LAN-Free的优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是投资高。
第 11 页
CommVault-Galaxy备份系统基本原理
1.1.4.4 Server-Free备份方式 另外一种减少对系统资源消耗的办法是采用无服务器(Serverless)备份技术。它是LAN-free的一种延伸,可使数据能够在SAN结构中的两个存储设备之间直接传输,通常是在磁盘阵列和磁带库之间。这种方案的主要优点之一是不需要在服务器中缓存数据,显著减少对主机CPU的占用,提高操作系统工作效率,帮助企业完成更多的工作。
无服务器备份有几种实施方式。
方法一,如下图所示,备份数据通过名为数据移动器的设备从磁盘阵列传输到磁带库上。该设备可能是光纤通道交换机、存储路由器、智能磁带或磁盘设备或者是服务器。数据移动器执行的命令其实是把数据从一个存储设备传输到另一个设备。实施这个过程的一种方法是借助于SCSI-3的扩展拷贝命令,它使服务器能够发送命令给存储设备,指示后者把数据直接传输到另一个设备,不必通过服务器内存。数据移动器收到扩展拷贝命令后,执行相应功能。它的主要缺点是必须具备特殊的设备。无服务器备份要求使用支持 SCSI-3 扩展复制命令集的智能设备。
第 12 页
CommVault-Galaxy备份系统基本原理
方法一,如下图所示,通过备份服务器发送控制指令,首先对需要备份的数据卷做一个快照(或者其他类似操作),形成一个副本,然后用备份服务器将此快照卷Mount上,利用备份服务器将此卷上的数据备份至备份设备上。
1.1.5 备份分类
备份类型主要有三种: 全备份 增量备份 差异备份
第 13 页
CommVault-Galaxy备份系统基本原理
除此之外,CommVault Galaxy 软件还提供了以下两种备份类型,它们的作用是辅助备份过程,节省关键备份窗口的时间:
辅助副本备份 合成完全备份
1.1.5.1 全备份 全备份将备份所有选定的文件,然后将每个文件标记为已备份(换句话说,存档属性被清除)。如果使用全备份,恢复所有文件时仅需具备最新的备份文件副本或磁带,全备份通常在首次创建备份集时执行。
1.1.5.2 增量备份 增量备份仅备份那些自上次全备份或增量备份以来创建或更改的文件。增量备份将文件标记为已备份(换句话说,存档属性被清除)。如果结合全备份和增量备份,恢复所有数据时必须具备最新的全备份集和所有增量备份集。
1.1.5.3 差异备份
差异备份仅备份那些自上次全备份或增量备份以来创建或更改的文件。差异备份不将文件标记为已备份(换句话说,存档属性不被清除)。如果结合全备份和差异备份,恢复所有数据时既需要最新全备份的文件或磁带,也需要最新差异备份的文件或磁带。
1.1.5.4 辅助副本 辅助(或次要)副本是备份数据的副本。已复制的数据是主要备份副本的真实映像。如果主要备份服务器、设备和媒体丢失或损坏,已复制的数据可用作热备用备份副本。主要副本和次要副本使用不同的媒体,通常使用不同的备份库。
1.1.5.5 合成全备份 合成备份(Synthetic backup)的含义就是将一个全备份和一些增量备份或者差分备份重新组成一个全备份,这样在恢复的时候,就好像一个全备份恢复一样快捷;而且这部分发生在介质管理器而不是客户端,可以有效利用空间并且减小客户端的负载。一般的用户可能不熟悉合成备份的用
第 14 页
CommVault-Galaxy备份系统基本原理
法,一般来说,合成备份可以将多个备份整合成一个可用的恢复文件,所以可以将它和传统备份统一起来使用。举例来说,如果用户创建一个三个月一次的全备份、每天一次的差分备份、一周一次的合成备份,那么每个星期一次的合成备份就会把上周的全备份和周内的差分备份,重新合成一个全备份文件,就好像每周一次全备份一样,而这样做的好处是将合成备份的工作移到介质服务器中完成,减少了客户端的负载。
1.1.5.6 各备份类型的优缺点
在确定备份类型时,必须考虑备份对网络带宽的影响和恢复数据所需的时间。表 1 描述了各类备份的优缺点。
表 1:备份类型比较
备份类型 优点 缺点 全备份 易于查找文件,因为文件都位于当前备份媒体上。文件恢复只需要一种媒体或一组媒体。 费时。如果文件不频繁进行更改,备份内容几乎完全相同。 增量 需要存储的数据最少。备份速度最快。 完全恢复系统需要的时间比全备份或差异备份长。 差异 恢复时仅需要最新全备份的媒体和差异备份的媒体,备份速度比全备份快。 完全恢复系统需要的时间比全备份长。如果大量数据发生变化,备份所需的时间长于增量备份的时间。 辅助副本 制作备用的备份磁带原样副本。与实际副本相比,辅助副本的生成速度更快。副本可现场保存供灾难恢复之用。 第 15 页
CommVault-Galaxy备份系统基本原理
备份类型 优点 缺点 综合完全 将全备份和增量备份合并到一个新的全备份中,该全备份位于保存在网络和/或关键服务器之外的库中。备份和还原时间减少。
1.1.6 备份技术的评判标准
在系统正常工作的情况下,数据备份工作毕竟算是系统的一个“额外负担”,或多或少的会给正常业务系统带来一定性能和功能上的影响。所以,架设数据备份系统时,如何尽量减少这种“额外负担”,从而更充分的保证系统正常业务的高效运行,也是数据备份技术发展的一个重要方向。对一个相当规模的系统来说,完全自动化的进行备份工作是对备份系统的一个基本要求。除此以外,CPU占用、磁盘空间占用、网络带宽占用、单位数据量的备份时间等等,这些都是需要重点考察的方面。千万不可小觑备份系统给应用系统带来的影响和对系统的资源占用,在实际环境中,一个备份作业运行起来,可能会占用掉一个中档小型机服务器CPU资源的60%!而一个未经妥善处理的备份日志文件,可能会占用源数据量30%的磁盘空间!这些数字都是来源于完全真是的实际环境,而且属于普遍现象,由此可见,备份系统的选择和优化工作也是一个至关重要的任务。选择的原则也并不复杂,一个好的备份系统,应该能够以很低的系统资源占用率和很少的网络带宽,来进行自动而高速度的数据备份。
考核备份系统主要有如下12个指标,CommVault SIMPANA有11条处于绝对领先地
位:
1.兼容性:指支持的操作系统和应用软件数量。比如Oracle 815, Oracle 816, Oracle 920, Solaris 7, Solaris 8, AIX 433, AIX 510算7个,CommVault的产品是2000年出来的,2000年以前版的操作系统和应用软件基本不支持,不过只有很少用户还在使用2000年以前的系统,基本都升级到新版本了。还有一个原因是:这些旧系统原厂也不支持了或已经倒闭了或被并购了或停产了,比如:Oracle 815,Oracle公司已经停止支持了, SCO UNIX已经被并购且停产了。
2.精确度:指对每个系统可以支持到多精确。比如邮件系统(主要包括Microsoft Exchange, IBM Lotus Notes/Domino, Novell eDirectory)从粗到细可以分为
第 16 页
CommVault-Galaxy备份系统基本原理
System,Mailbox,Mail,如果支持到System级别,则恢复操作会影响所有用户-所有用户在最后一次备份后的邮件都没有了;如果支持到Mailbox级别,则恢复操作会影响到这个用户-这个用户在最后一次备份后的邮件都没有了;如果支持到Mail级别就非常理想了-不会造成任何损失。CommVault SIMPANA对AD,Exchange,Lotus,eDirectory,SharePoint,Oracle等等应用的精度都是业界最高的。
3.性能:指备份和恢复的速度。CommVault SIMPANA的性能是绝对领先的。除了专利的DataPipe技术,CommVault在SIS,MultiPlexing,MultiStream,Intelligent Dynamic Drive,Synthetic Full,Chunk Based Media Management等等方面都是唯一或最好的。
4.可管理性:指日常维护成本和回去所要信息的难易程度。CommVault的系统被设计成自管理性的系统,维护成本很低,操作非常简单,有丰富和灵活的报表系统,绝对是最好的。
5.一致性(安全性):指备份系统能否保持原来系统一致而不破坏原有的用户权限等。CommVault SIMPANA甚至完全集成到AD中,100%保证系统一致性。
6. 稳定性(可靠行):CommVault系统的成功率在99%以上,远远超过其他系统70%左右的水平。
7.扩展性:CommVault一套系统可以管理成千上万台服务器,远远超过其他系统100到200台左右的水平,CommVault现有用户中有超过10000个SAN实例的应用,远远超过其他系统中300个左右的水平。
8.前瞻性:CommVault连续多年被Gartner,ESG等组织评为最技术领先的公司。 9. 对生产系统的影响:跟其他系统差不多。
10.硬件设备无关性:CommVault基于操作系统之上,只要操作系统识别,我们全部支持如IBM、HP、EMC等各种存储设备,这种支持包括用户以前采购的硬件,和以后用户选择硬件品牌的自主性。
11、升级扩展:CommVault一套源代码开发,120多项注册专利,对于用户未来的升级和新功能扩展需求,只需要升级相应模块。
12、一体化数据安全解决方案:CommVault在数据安全方面提供全方位保护,可以根据用户需求分步实施,如一期实现备份,二期快照(需要恢复2小时或1小时前的数据),三期归档(数据量日积月累,为了减少主存储负担,需要向二级存储迁移,)四期连续数据保护(实现分钟级
第 17 页
CommVault-Galaxy备份系统基本原理
别类数据恢复),容灾(操作系统崩溃,同城异地的数据备份及恢复),五期搜索(离线数据和在线数据,类似于谷歌一样的搜索和查询),用户将来增加任何一个功能,只需要增加相应的模块,就完全实现。
1.1.7 归档和迁移
1.2 容灾技术
1.2.1 RPO同RTO
在数据管理中,RPO(Recovery Point Objective)是指能把数据恢复到过去的那一个时间点,RTO(Recovery Time Objective)是指在出现问题后,什么时候可以恢复数据。RPO可简单的描述为企业能容忍的最大数据丢失量,RTO可简单的描述为企业能容忍的恢复时间。
不同技术手段RPO和RTO的比较:
数据保护一般有3个技术手段实现;持续可用(Mirror),快速恢复(SnapShot),可以恢复(备份),这3种方式的投资和造成数据丢失是不同的,请看下图:
第 18 页
CommVault-Galaxy备份系统基本原理
由此可以看出,不同的PRO指标实现的代价和方式都不同。而这些技术手段的RTO也是不同的;请看下图:
1.2.2 容灾的级别
1.2.2.1 《信息系统灾难恢复规范》(GB/T 20988-2007 )
2007年7月,国务院信息化工作办公室领导编制的《重要信息系统灾难恢复指南》正式升级成为国家标准《信息系统灾难恢复规范》(GB/T 20988-2007 )。这是中国灾难备份与恢复行业的第一个国家标准,并于2007年11月1日开始正式实施。
第 19 页
CommVault-Galaxy备份系统基本原理
《信息系统灾难恢复规范》规定了信息系统灾难恢复应遵循的基本要求,适用于信息系统灾难恢复的规划、审批、实施和管理。《规范》具体对灾难恢复行业相应的术语和定义、灾难恢复概述(包括灾难恢复的工作范围、灾难恢复的组织机构、灾难恢复的规划管理、灾难恢复的外部协作、灾难恢复的审计和备案)、灾难恢复需求的确定(包括风险分析、业务影响分析、确定灾难恢复目标)、灾难恢复策略的制定(包括灾难恢复策略制定的要素、灾难恢复资源的获取方式、灾难恢复资源的要求)和灾难恢复策略的实现(包括灾难备份系统计数方案的实现、灾难备份中心的选择和建设、专业技术支持能力的实现、运行维护管理能力的实现、灾难恢复预案的实现)等内容作了具体描述。
同时,在附录A对灾难恢复能力作了等级划分(共6级:第1级 基本支持,第2级 备用场地支持,第3级 电子传输和部分设备支持,第4级 电子传输及完整设备支持,第5级实时数据传输及完整设备支持,第6级数据零丢失和远程集群支持);附录A对灾难恢复能力等级评定原则、灾难备份中心的等级等也作了规范要求。附录B对灾难恢复预案框架、附录C对相应行业 RTO/RPO与灾难恢复能力等级的关系比例作了规范要求。信息系统灾难恢复能力等级与恢复时间目标(RTO)和恢复点目标(RPO)具有一定的对应关系,各行业可根据行业特点和信息技术的应用情况制定相应的灾难恢复能力等级要求和指标体系。
第 20 页
CommVault-Galaxy备份系统基本原理
第 21 页
CommVault-Galaxy备份系统基本原理
第 22 页
CommVault-Galaxy备份系统基本原理
1.2.2.2 国际Share78标准
据国际标准 SHARE78的定义,灾难恢复解决方案可根据以下的主要方面所达到的程度而分为七级,即从低到高有七种不同层次的灾难恢复解决方案。可以根据企业数据的重要性以及您需要恢复的速度和程度,来设计选择并实现您的灾难恢复计划。
备份 /恢复的范围 灾难恢复计划的状态
在应用中心与备份中心之间的距离 应用中心与备份中心之间是如何相互连接的 数据是怎样在两个中心之间传送的 有多少数据被丢失
怎样保证更新的数据在备份中心被更新 备份中心可以开始备份工作的能力
在 1992年Anaheim的SHARE78,M028这一会议报告中,自动的异地远程恢复任务被定义有七个层次:
Tier 0 - 没有异地数据(No off-site Data)
Tier0被定义为没有存储信息和建立备份硬件平台的需求,也没有发展应急计划的需求。数据仅在
第 23 页
CommVault-Galaxy备份系统基本原理
本地进行备份恢复,没有数据送往异地,这种方式是最低成本的灾难恢复解决方案。事实上这种灾难恢复并没有真正灾难恢复的能力,因为它的数据并没有送往远离本地的地方,而数据的恢复也是利用的本地的记录。
Tier 1 - PTAM卡车运送访问方式 (Pickup Truck Access Method)
Tier1的灾难恢复方案必须设计一个应急方案,能够备份所需要的信息并将它存储在异地,然后根据恢复的具体需求,有选择地建立备份平台,但不提供数据处理的硬件。
PTAM是一种被用于许多中心的备份的标准的方式,数据在完成写操作的一些时候,将会被送到远离本地的地方,同时准备有数据恢复的程序。在灾难发生后,一整套安装需要在一台未开启的计算机上重新完成。系统和数据可以被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低(仅仅需要传输工具的消耗以及存储设备的消耗)。但同时有这样的问题,那就是难于管理,即很难知道什么样的数据在什么样的地方。
Tier 2 - PTAM卡车运送访问方式+热备份中心 (PTAM + Hot中心)
Tier2相当于Tier1再加上热备份中心能力的进一步的灾难恢复。热备份中心拥有足够的硬件和网络设备去支持关键应用的安装需求,这样的应用是十分的关键的,它必须在灾难发生的同时,在异地有正运行着的硬件提供支持。这种灾难恢复的方式依赖于PTAM方法去将日常数据放入仓库,当灾难发生的时候,数据再被移动到一个热备份的中心。虽然移动数据到一个热备份中心增加了成本,但却明显降低了灾难恢复时间。
Tier 3 - 电子链接 (Electronic Vaulting)
Tier3是在Tier2的基础上用电子链路取代了卡车进行数据的传送的进一步的灾难恢复。接收方的硬件必须与主中心物理地相分离,在灾难发生后,存储的数据用于灾难恢复,由于热备份中心要保持持续运行,增加了成本。但消除了传输工具的需要,提高了灾难恢复速度。
Tier 4 - 活动状态的备份中心 (Active Secondary中心)
Tier4灾难恢复具有两个中心同时处于活动状态并管理彼此的备份数据,允许备份行动在任何一个方向发生。接收方硬件必须保证与另一方平台物理地分离,在这种情况下,工作负载可能在两个中心之间分享,中心1成为中心2的备份,反之亦然。在两个中心之间,彼此的在线关键数据的拷贝不停地相互传送着。在灾难发生时,需要的关键数据通过网络可迅速恢复,通过网络的切换,关键应用的恢复也可降低到小时级或分钟级。
Tier 5 - Two-Site Two-Phase Commit
Tier5在Tier4的基础上管理着被选择的数据(根据单一commit的范围在本地和远程数据库中同时
第 24 页
CommVault-Galaxy备份系统基本原理
更新数据),也就是说,在更新请求被认为是满意之前,Tier5需要生产中心与备份中心的数据都被更新。我们可以想象这样一种情景,数据在两个中心之间相互映象,由远程two-phasecommit来同步。Tier5为关键应用使用了双重在线存储,在灾难发生时,仅传送中的数据被丢失,恢复时间被降低到分钟级。
Tier 6 - 0数据丢失 (Zero Data Loss)
Tier6可以实现0数据丢失率,同时保证数据立即自动地被传输到恢复中心。Tier6被认为是灾难恢复的最高的级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力。Tier6是灾难恢复中最昂贵的方式,但也是速度最快的恢复方式。
Tier 7 - 0 数据丢失,自动系统故障切换
第 7层和第6层实现之间的区别是,当一个工作中心发生灾难时,第7层实现能够提供一定程度的跨站点动态负载平衡和自动系统故障切换功能。现在已经证明,为实现有效的灾难恢复,无需人工介入的自动站点故障切换功能是需要一个需要被纳入考虑范围的重要事项。
1.2.3 备份同容灾
容灾系统会完整地把生产系统的任何变化复制到容灾端去,包括不想让它复制的工作,比
如不小心把计费系统内的用户信息表删除了,同时容灾端的用户信息表也会被完整地删除。如果是同步容灾,那容灾端同时就删除了;如果是异步容灾,那容灾端在数据异步复制的间隔内就会被删除。这时就需要从备份系统中取出最新备份,来恢复被错误删除的信息。因此容灾系统的建设不能替代备份系统的建设。
对于企业而言到底应该如何建设自己的灾备系统,是只建设备份系统、还是只建设容灾系
统、还是需要二者同时建设、或者是分步骤的建设,谁先谁后等问题,主要根据业务的需求而定:
(1)需要防范的灾难类型:
企业信息系统可能遇到的灾难类型及其发生的比例如下:
常见的数据失效原因 第 25 页
CommVault-Galaxy备份系统基本原理
电力波动 自然灾害 软硬件设备故障 爆炸、意外事故 误操作 人为破坏 32.8% 39.1% 16.6% 8.7% 2.0% 0.8% 对于“人为错误”、“软件损坏和程序错误”加上“病毒”等这些都称为逻辑错误,占总
故障的 56%,这些错误只能通过备份系统才能防范;
对于 “硬件和系统故障”以及“自然灾难”等故障可以通过在容灾系统(或者异地备
份)来防范,占总故障率的44%。
(2)允许的RTO和RPO指标
从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO
(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。
一般而言:容灾系统能够提供较好的RTO和RPO指标。 (3)系统投资
总的说来,建设备份系统的投资远比建设标准意义的容灾系统的投资小得多:
备份系统的投资规模一般在几百万; 而最节省的一套容灾系统投资都将上千万;
因为建设备份系统所需的资源在以下几个方面的投资都远远小于容灾系统:
备份系统 容灾系统 SAN网络 TCP/IP网络 传输链路 带宽一般<1GB 带宽要求10GB 独占光纤资源 第 26 页
CommVault-Galaxy备份系统基本原理
容量小 盘阵需求 只需要中档阵列 容量大 必需高端阵列 系统维护成本 几乎无需维护 需建一个团队维护
1.2.4 复制技术
1.2.4.1 同步复制 1.2.4.2 异步复制 1.3 备份设备简介
1.3.1 磁带设备
1.3.1.1 存储容量
存储容量是指在数据未被压缩前磁带机所能存储的最大数据量。这个数值取决于两个因素,一是单盒磁带的存储容量,二是磁带机所能容纳的磁带数目。由于磁带机采用多种不同的备份技术所以存储容量也不一致。通常有以下几类:
第 27 页
CommVault-Galaxy备份系统基本原理
1.3.1.2 压缩后存储容量
压缩后存储容量是指数据备份到磁带机经过压缩后所能容纳的数据量。这个数值取通常是压缩前容量的两倍。常见有以下几类:
1.3.1.3 持续传输率 持续传输率 (Sustained Transfer Rate)是指单位时间内,磁头把数据写入磁带或从磁带读出的稳定的速率,而不是突发的数值。单位通常是Mb/s(兆/秒)。主流磁带机技术的数据传输率:
1.3.1.4 压缩后传输率 压缩后传输率是指磁带数据经过压缩后,磁头所读取数据的速率。单位通常是Mb/s(兆位/秒)。主流磁带机技术的压缩后传输率:
第 28 页
CommVault-Galaxy备份系统基本原理
1.3.1.5 MTBF MTBF,即平均无故障时间,英文全称是“Mean Time Between Failure”。是衡量一个产品(尤其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁带机产品的MTBF值不应低于200000小时。
通常,我们在产品的手册或包装上能够看到这个MTBF值,如8000小时,2万小时,那么,MTBF的数值是怎样算出来的呢,假设一台电脑的MTBF为3万小时,是不是把这台电脑连续运行3万小时检测出来的呢?答案是否定的,如果是那样的话,我们有那么多产品要用几十年都检测不完的。其实,关于MTBF值的计算方法,目前最通用的权威性标准是MIL-HDBK-217、GJB/Z299B和Bellcore,分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算,GJB/Z 299B是我国军用标准;而Bellcore是由AT&T Bell 实验室提出并成为商用电子产品MTBF值计算的行业标准。
MTBF计算中主要考虑的是产品中每个器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,例如,同一产品在不同的环境下,如在实验室和海洋平台上,其可靠性值肯定是不同的;又如一个额定电压为16V的电容在实际电压为25V和5V下的失效率肯定是不同的。所以,在计算可靠性指标时,必须考虑上述多种因素。所有上述这些因素,几乎无法通过人工进行计算,但借助于软件如MTBFcal软件和其庞大的参数库,我们就能够轻松的得出MTBF值。
其实,MTBF值如何算出并不是我们所关心的问题,我们应该把重点放在一个产品的MTBF的值到底有多少上,对于用户来讲,应该选用MTBF值高的产品。
1.3.1.6 磁带尺寸 磁带尺寸广义上讲包括磁带的宽度、长度或者磁带盒的规格。磁带盒常见的规格有3.5英寸(AIT磁带居多)和5.25英寸(DLT磁带居多)。目前常用的磁带机磁带有以下几种规格。
第 29 页
CommVault-Galaxy备份系统基本原理
1.3.1.7 存储技术
当前的磁带机支持的备份技术主要有DAT、8mm、DLT、LTO、AIT及VXA等。 DAT技术
DAT(Digital Audio Tape)技术又可以称为数码音频磁带技术,也叫4mm磁带机技术,最初是由惠普公司(HP)与索尼公司(SONY)共同开发出来的。这种技术以螺旋扫描记录(Helical Scan Recording)为基础,将数据转化为数字后再存储下来,早期的DAT技术主要应用于声音的记录,后来随着这种技术的不断完善,又被应用在数据存储领域里。4mm的DAT经历了DDS-1、DDS-2、DDS-3、DDS-4几种技术阶段,容量跨度在1GB-12GB。目前一盒DAT磁带的存储量可以达到12GB,压缩后则可以达到24GB。DAT技术主要应用于用户系统或局域网。
8mm技术
8mm技术由Exabyte(安百特)公司在1987年开发,采用螺旋扫描技术,其特点是磁带容量大,传输速率高,它在较高的价位上提供了相对较高容量的存储解决方案。8mm磁带机的发展经历了8200、8500、8500c和8900(mammoth)的数据格式,容量从最初的2GB发展到现在的40GB,传输速率最快可达6M/s。新一代的Mammoth-2技术又进一步提升,存储容量达到170GB(非压缩60GB)传输速率30M/s(非压缩12M/s),在技术上有广阔的发展空间。主要制造商是Exabyte公司。
DLT技术
DLT(Digital Linear Tape-数字线性磁带)技术源于1/2英寸磁带机。1/2英寸磁带机技术出现很早,主要用于数据的实时采集,如程控交换机上话务信息的记录,地震设备的震动信号记录等等。DLT磁带由DEC和Quantum(昆腾)公司联合开发。由于磁带体积庞大,DLT磁带机全部是5.25英寸全高格式。DLT产品由于高容量,主要定位于中、高级的服务器市场与磁带库系统。目前DLT驱动器的容量从10GB到80GB不等,数据传送速度相应由1.25MB/秒至10MB/秒。另外,一种基于DLT的Super DLT(SDLT)是昆腾公司2001年推出的格式,它在DLT技术基础上结合新型磁带记录技术,使用激光导引磁记录(LGMR)技术,通过增加磁带表面的记录磁道数使记录容量增加。目前SDLT的容量为160GB,近3倍于DLT磁带系列产品,传输速率为11MB/s,是DLT的2倍。
LTO技术
第 30 页
CommVault-Galaxy备份系统基本原理
LTO(Linear Tape Open)技术,即线性磁带开放协议。是由HP、IBM、Seagate这三家厂商在1997年11月联合制定的,其结合了线性多通道、双向磁带格式的优点,基于服务系统、硬件数据压缩、优化的磁道面和高效率纠错技术,来提高磁带的能力和性能。
LTO技术有两种存储格式,即高速开放磁带格式Ultrium和快速访问开放磁带格式Accelis,它们可分别满足不同用户对LTO存储系统的要求,Ultrium采用单轴1/2英寸磁带,非压缩存储容量100GB、传输速率最大20MB/s、压缩后容量可达200GB,而且具有增长的空间。非常适合备份、存储和归档应用。Accelis磁带格式则侧重于快速数据存储,Accelis磁带格式能够很好地适用于自动操作环境,可处理广泛的在线数据和恢复应用。
AIT技术
AIT是指先进智能磁带,英文为Advanced Intelligent Tape,具有螺旋扫描、金属蒸发带等先进技术,AIT的数据保护性能比较突出,AIT已经发展到目前的AIT-3,目前开发AIT技术的索尼公司和专注在AIT技术上开发产品的Spectra Logic公司都在大力的推广采用AIT的产品。
AIT采用的是螺旋扫描方式进行记录,与家用录像机的工作原理一样,这样一来,整个磁带机中,只有磁鼓是高速旋转,其它部件,如磁带、伺服机构都是低速运动的。这样的结构紧凑合理、易于设计和维护。而LTO(Linear Tape Open)、DLT(Digital linear Tape)、SDLT(Super Digital linear Tape)都是线性记录,像录音机一样,磁头是固定不动的,磁带直线运动通过磁头。与录音机不同的是,磁带机要保证记录速度,就要让磁带高速通过磁头,为此,就需要复杂机构控制磁带抖动、冷却高速运动的各种部件和轴承。在相同材料下,采用螺旋扫描的方式能使材料寿命延长。
从应用方面讲,对于企业级用户来说,AIT磁带库可用于数据备份。与其它同容量、同传输速率的产品相比,AIT机架式的带库具有体积小、能耗低、容量大、价格便宜的优点。对于中端用户,AIT自动加载机是较好的选择。考虑到数据容量和自动备份等问题,可选用能容纳4盘磁带的自动加载机。
第 31 页
CommVault-Galaxy备份系统基本原理
VXA技术
VXA技术是由Exabyte(安百特)公司开发的磁带备份技术,VXA技术不依赖于精确的磁头和磁道位置来保证读写的可靠性,它不像流式磁带设备为定位磁道而需要昂贵的高精度的部件和精确的机械零件。不同于传统的磁带驱动器,VXA通过自动调节磁带移动易和主机的传输速率相匹配而完全消除磁带“回扯”问题,能够显著提高介质和驱动器的可靠性,进而优化了备份和存储。VAX 以包的格式多些数据,对磁带上的数据记录区进行无空隙扫描,目前已经从VAX-1发展到VAX-2,在保持高可靠性的基础上,提高了速度和容量,单盒磁带容量为160GB(非压缩为80GB),速度为每秒12M(非压缩为6M)。
1.3.1.8 装带方式 自动装带
自动装带方式的磁带机叫做自动加载磁带机,它实际上是将磁带和磁带机有机结合组成的。自动加载磁带机是一个位于单机中的磁带驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中拾取磁带并放入驱动器中,或执行相反的过程。它可以备份100GB-200GB或者更多的数据。自动加载磁带机能够支持例行备份过程,自动为每日的备份工作装载新的磁带。一个拥有工作组服务器的小公司可以使用自动加载磁带机来自动完成备份工作。
手动装带
一般手动换带、装带方式的磁带机多为外置式磁带机,这种磁带机由于没有自动更换装置,所以价格低廉,适合小型数据备份,现在这类产品越来越少了。
磁带机(Tape Drive)一般指单驱动器产品,通常由磁带驱动器和磁带构成,是一种经济、可靠、容量大、速度快的备份设备。这种产品采用高纠错能力编码技术和写后即读通道技术,可以大大提高数据备份的可靠性。根据装带方式的不同,一般分为手动装带磁带机和自动装带磁带机,即自动加载磁带机。
自动加载磁带机实际上是将磁带和磁带机有机结合组成的。自动加载磁带机是一个位于单机中的磁带驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中拾取磁带并放入驱动器中,或执行相反的过程。它可以备份100GB-200GB或者更多的数据。自动加载磁带机能够支持例行备份过程,自动为每日的备份工作装载新的磁带。一个拥有工作组服务器的小公司可以使用自动加载磁带机来自动完成备份工作。
第 32 页
CommVault-Galaxy备份系统基本原理
1.3.2 D2D2T备份
在过去的数据备份中,磁带具有自身的先天性优势,高容量、低价格、可离线保存/管理等,因此,近线磁带备份当仁不让的成为备份领域中曾经的主力军,占据大片江山,辉煌一时。但由于用户的IT需求在不断发展,备份窗口(时间)也在不断缩减,于是D2D2T (磁盘到磁盘到磁带)的备份方式应运而生。通过D2D2T的备份方式,数据将经由主磁盘(如FC/SCSI磁盘)先以磁盘镜像的形式备份到次级盘(如ATA磁盘),以提高运行效率,有效地缩短备份窗口(时间),待备份窗口关闭后再由自动将资料复制到自动磁带库上。通过建立这样一个存储流程,不但可以实现较高的备份效率,在恢复时还具有更好的灵活性,比如根据运行速度或恢复时间限制,从磁盘或磁带恢复数据。除此之外,还可以节省磁带设备的维护成本,通常而言,为维护磁带系统的稳定性经常使得系统管理员也要付出极大的精力,磁带平日存放要防潮以免发霉,不可放置于强磁区以免磁化,不可长期闲置以免粘带,不可频繁存取某个带段以免损带,另外,磁头也须经常清洗,还要定期检查、保养机械手装置以免卡带。
从具体操作流程来说,D2D2T的应用分为三个步骤, 1-从FC磁盘(一级盘)将数据读出 2-备份到ATA磁盘(二级盘) 3-从ATA磁盘(二级盘)到磁带库系统
与磁带相比具有下列优势:
快速的备份和恢复数据。
磁盘操作比磁带快,特别在装载和查找时。 烦恼的磁带故障被消除。
磁盘具有随机读写和优化查找的功能,而磁带是个顺序设备,对随机读写文件很慢。 磁盘能支持多台主机同时并行存取。
磁盘的存储方案比磁带方案占用更少的机房面积。 利用磁盘存储方案可消除操作磁带时的人为错误。
第 33 页
CommVault-Galaxy备份系统基本原理
1.3.3 VTL
什么是虚拟带库(Virtual Tape Library,VTL)呢?虚拟带库就是以磁盘作为自身存储介质,并能仿真为物理磁带库的产品。简单的说,虚拟带库就是将磁盘空间虚拟为磁带空间,能够在传统的备份软件上实现和传统磁带库同样功能的产品。
传统的磁带库的存储介质为磁带,单盘磁带的最大容量现在可以达到400GB(LTO4,非压缩),磁带的优势是可以集中的保存,数据的移动比较方便,但是磁带介质不是非常稳定,容易受粉尘、湿度、磁粉、粘连、霉点等因素的影响,出现读写错误,对保存环境的要求比较高。带库里面的机械手和驱动器属于精密机械设备,经常容易发生故障,速度比较慢,恢复时间比较长。
鉴于传统磁带的这些缺陷,虚拟磁带库的概念早在10余年前即已被IBM,StorageTek等著名存储厂商所采用。然而,由于技术和市场的原因,市场认知度一直很低。而在近些年,磁盘技术快速发展,出现了多种类型磁盘(SCSI、FC、ATA、SATA),使单位容量磁盘存储的价格急剧下降,进而使磁盘阵列作为备份设备的应用也愈加广泛,虚拟带库也越来越成为备份市场的焦点。
虚拟带库将使用磁盘做为存储介质,使用软件在逻辑上将磁盘存储系统(包括SCSI或者光纤阵列或者SAN存储网络等)虚拟为传统的磁带库设备,自动的在逻辑上实现机械手,驱动器的功能,磁盘存储系统的RAID,镜像等功能可以从底层保护备份的数据。虚拟磁带库能够和各大厂家的备份软件无缝的兼容,实现许多高级的备份功能,最大程度上保护用户的数据。
虚拟带库的实现可以大致分为三种方式。第一,纯软件方式,即将磁带库模拟软件直接安装在备份服务器上,把备份服务器的文件系统分区模拟成磁带库,从而使备份软件以磁带库方式使用磁盘文件系统,目前有厂家在备份软件里面集成了类似的产品。这种方式磁盘本质上仍然在线,而且对备份主机的负担比较大,使用的环境有局限性,优点是成本比较低。第二种,专用服务器级虚拟磁带库方案,该方案实际上是另外一种虚拟磁带库的软件实现方案,通过把虚拟磁带库管理软件安装在一台独立的专用服务器内,而将该服务器及所连接的磁盘存储设备模拟成磁带库。这种方案的特点是速度比较快,而且数据受主机的影响小,不足是需要利用一台的服务器作为虚拟磁带库管理器,系统优化性略低。第三,专用控制器级集成虚拟磁带库设备方案,将磁带库模拟管理软件固化在特别设计的硬件设备中,就形成了专用的虚拟磁带库设备,这种设备需要配置一定数量和类型的主机接口和后端存储磁盘阵列接口。专用的虚拟磁带库设备硬件结构与不同于服务器,设计采用了精简的硬件模块和精简的操作系统内核(一般为Linux内核),并且充分考虑了与主机及存储设备的连接能力。
第 34 页
CommVault-Galaxy备份系统基本原理
专用的虚拟磁带库设备的出现标志着虚拟磁带库技术终于突破了操作系统和PC服务器架构的限制,使虚拟磁带库真正成为了一种独立的外设,其使用方式也更接近普通磁带库,而其优越性能也体现得更加充分。
第 35 页
因篇幅问题不能全部显示,请点此查看更多更全内容