Backup Exec采用介质集来分类管理介质,通过为介质集设置适当的附加周期和覆盖保护周期,可以实现所需的介质循环策略,我发现这方面心存疑惑的网友特别多,今天就来解释一下Backup Exec的介质管理。
首先来说说什么是介质(Media),介质就是存储数据的磁带(当然也包括通过磁盘文件实现的虚拟磁带),每一盘磁带(或虚拟磁带)都是一个介质。
对介质的使用有两种方式:附加(Append)和覆盖(Overwrite)。附加也就是追加,假设一盘磁带的容量是200G,第一次写入时从磁带头开始写入,写了20G后备份完成,第二次写入时如果采用附加写入方式,磁带会先绕到上一次写入数据的尾部(磁带上有标记),接着上一次的数据写入,如果又写入了30G,则两次写入完成后磁带的可用空间就剩150G了。与附加写入相对应的就是覆盖写入,磁带是流式访问媒体,与磁盘的随机访问不同,对于一盘存有数据的磁带,不管它的空间是否用光,也不管上面的数据是一次写入还是在不同的时刻多次写入,如果我们要覆盖它上面的数据,一定是从头写入,擦除掉上面所有的数据,而不能像磁盘一样只清除一部分内容以腾出可用空间。
这里顺便说一下磁带的容量(Capacity),如果你的磁带上标记的容量是20/40G,则表示在不采用任何压缩技术的情况下可以写入20G的数据,当然这是个理论值,实际也可能写不到20G。通常我们在向磁带写入数据会采用软件或硬件压缩技术,这时候写入的数据量就可以超过20G了,数据的压缩比率是不确定的,像前面的例子,厂商在磁带上写的40G就是按照2:1的压缩比来计算的,实际的压缩比是由被压缩的数据决定的。总之,如果你一直向磁带写入数据,磁带机会一直写到检测到磁带尾部时为止,对于一盘20G的磁带来说,这时候可能己经写入了十几个G,也可能是20G,也可能是30G,也可能是60G……
为了便于管理介质,Backup Exec使用了介质集(Media Set),它是介质的逻辑分组,BE中有两类介质集,一类是系统介质集(安装好以后就有的,固定用途的),一类是用户介质集(用户可以自己创建的)。
系统介质集包括:
报废介质(Retired Media),如果一盘磁带用得太旧了,你不想再用它了,在软件中把表示该磁带的介质拖到这个介质集,就可以把它从BE的数据库中删除了。
暂存介质(Scratch Media),这里面的介质不受任何保护,可以在需要时取用,新介质和刚刚被清除数据的介质都位于这个介质集,你也可以把其它介质集中的介质拖到这里(如果里面的数据不再需要,磁带可以另作它用)。
清洗介质(Clean Media)用于清洗磁头的清洗带。
导入介质(Import Media)在其它系统中使用过的,写有数据的磁带。
用户介质集可以根据需要创建,你可以为每个用户介质集设置不同的附加周期(Append Period)和覆盖保护周期(Overwrite Protection Period),如果附加周期设置为m天,表示从第一次写入开始m天之内可以继续附加写入直到磁带写满;如果覆盖周期设置为n天,表示在最后一次写入n天之后才可以覆盖磁带上的数据。
这部分不太好理解,我通过一个例子来说明吧。假设你的备份要求如下:
你有40G的磁带若干。
每周五晚上8:00做全备,大约30G数据,需要1小时备份完成,周一至周四晚上做增量备份,大约5G数据,需要10分钟备份完成。全备份的磁带要保留一个月,增量备份的磁带只要保留一周。
按照上面的要求,我们可以建立两个介质集,假定一个名为full,一个名为incremental。
最开始的时候,做完标注(Label)的新磁带都位于暂存介质集。
第一次做全备份时,备份作业指定目标介质集为full,但是full里面没有介质,这时BE会从暂存介质里面选择一盘磁带,指示磁带机向该磁带写入数据,写入完成后可用空间大约还有10G,所以我们可以考虑下一次做全备份时使用一盘新磁带。因为写入一次后的磁带不需要再做附加写入,我们可以将介质集full的附加周期设置为0,下周五时第二次全备份开始,又一盘新磁带被使用,依此类推,根据要求,最初写入的磁带要保留一个月,也就是说在一个月内不应该被覆盖,我们可以将介质集full的覆盖保护周期设置为4周,这样在第5周时可以覆盖第1周时写入的磁带,第6周时可以覆盖第2周时写入的磁带。。。。。四盘磁带可以依次循环使用。
第一次做增量备份时,备份作业指定目标介质集为incremental,但是incremental里面没有介质,这时BE会从暂存介质里面选择一盘磁带,指示磁带机向该磁带写入数据,写入完成后可用空间大约还有35G,所以我们可以考虑接下来的3次增量备份还使用这一盘磁带。我们可以将介质集incremental的附加周期设置为4天,下周一新的增量备份开始时,这盘磁带可以被重复使用了,所以我们可以将覆盖保护周期设置为3天(为什么是3天,要说明一下,覆盖保护周期是按最后一次写入数据完成时算起,最后一次写入是周四晚上,则周日晚上磁带超过覆盖保护周期,周一晚上就可以用了)。
与这一部分有关的还有一个介质覆盖级别的概念,通常用户默认的部分(Partial)级别就可以了。