一、rsync
1.1rsync简介
(1)rsync是一款开源的、快速的、多功能的、可实现全量及增量的本地或远程数据同步备份的优秀工具。并且可以不进行改变原有数据的属性信息,实现数据的备份迁移特性,可以在不同主机之间镜像同步整个目录树,支持增量备份,并保持链接和权限,且采用优化的同步算法,传输前执行压缩,因此非常适用于异地备份、镜像服务器等应用。
(2)在远程同步任务中,负责发起rsync同步操作的客户机称为发起端,而负责响应来自客户机的rsync同步操作的服务器称为同步源。在同步过程中,同步源负责提供文件的原始位置,发起端应对该位置具有读取权限。
(3)rsync是 Linux系统下的数据镜像备份工具,使用快速增量备份工具Remote sync可以远程同步,可以在不同主机之间进行同步,可实现全量备份与增量备份,保持链接和权限,且采用优化的同步算法。
(4)传输前执行压缩,因此非常适合用于架构集中式备份或异地备份等应用。同时Rsync支持本地复制,或者与其他SSH、rsync主机同步。
(5)rsync软件支持跨平台,适用于unix/ linux/windows等多种操作系统平台
(6)rsync是一个快速和非常方便的文件复制工具。它能本地复制,远程复制,或者远程守护进程方式复制,它提供了大量的参数来控制其行为的各个方面,并且允许非常灵活的方式来实现文件的传输复制
(7)以其delta-transfer算法闻名。
(8)rsync监听端口:873
(9)rsync运行模式:C/S
1.2rsync同步方式
完全备份:原有的数据全部传送,把原来的文件和新的文件一起统一传送,全量复制,效率低
差量备份:备份上次完全备份以后有变化的数据(针对的上次的完全备份,备份过程中不清除存档属性)
增量备份:在传输数据之前通过一些算法通过你有的数据和我有的数据进行对比,把不一样的数据通过网络传输增量复制,效率高
2:rsync特性
可以镜像保存整个目录和文件系统
可以很容易做到保持原文件的权限、时间、软硬连接等
无须特殊权限即可安装
快速
第一次同步时rsync会复制全部内容,但在下一次只传输修改过的文件
rsync在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的宽带
安全
可以使用scp、ssh等方式来传输文件
也可通过直接socket连接
支持匿名传输,以方便进行网站镜像
Top
二、rsync同步源
指备份操作的远程服务器,也称为备份源
在远程同步任务中,负责发起 rsync 同步操作的客户机称为客户端,而负责**响应来自客户端的 rsync 同步操作的服务器称为备份源**,也称之为同步源
在下行同步(下载)中,同步源负责提供文档的原始位置,发起端应对该位置有读取权限
在上行同步(上传)中,同步源负责提供文档的目标位置,发起端应对该位置具有写入权限
源(服务端)发起的是下行;客户端发起的是上行
也可以用推拉来理解(推:下行;拉:上行)
发起端:负责发起rsync同步操作的客户机叫做发起端,通知服务器我要备份你的数据
备份源:负责响应来自客户机rsync同步操作的服务器叫做备份源,需要备份的服务器
服务端:运行rsync服务,一般来说需要备份的服务器
客户端:存放备份数据
推:一台主机负责把数据传输给其他主机,服务器开销很大,比较适合后端服务器少的情况
拉:所有主机定时去找一台拉数据,可能会导致数据的缓慢
推:目的主机配置为rsync服务器,源主机周期性的使用rsync命令把要同步的目录推过去(需要备份的机器是客户端,存储备份的机器是服务端)
拉:源主机配置rsync服务器,目的主机周期性使用rsync命令把要同步的目录拉过来(需要备份的机器是服务端,存储备份的机器是客户端)
三、rsync下行同步配置
1、配置rsync源服务器
(1)关闭防火墙和安全功能
|
(2)安装rsync软件包
|
(3)建立/etc/rsyncd.conf配置文件
|
(4)为备份账户创建数据文件
|
(5)保证所有用户对源目录/var/www/html都有读的权限
|
(6)启动rsync服务程序
|
(7)关闭rsync服务
|
(8)创建文件用于测试
|
2、发起端配置
基本格式:rsync [选项] 原始位置 目标位置
(1)常用选项
常用选项 | 说明 |
-r | 递归模式,包含目录及子目录中的所有文件 |
-l | 对于符号链接文件仍然复制为符号链接文件 |
-v | 显示同步过程的详细信息 |
-z | 在传输文件时进行压缩 |
-a | 归档模式,保留文件的权限、属性等信息,等同于“-rlptgoD” |
-p | 保留文件的权限标记 |
-t | 保留文件的时间标记 |
-g | 保留文件的属组标记(仅超级用户使用) |
-o | 保留文件的属主标记(仅超级用户使用) |
-H | 保留硬链接文件 |
-A | 保留ACL属性信息 |
-D | 保留设备文件及其他特殊文件 |
--delete | 删除目标位置有而原始位置没有的文件 |
--checksum | 根据校验和(而不是文件的大小、修改时间)来决定是否跳过文件 |
(2)将指定的资源下载到本地/opt目录下进行备份
|
(3)免交互格式配置
|
(4)加入到计划性任务
|
四、rsync+inotify实时同步(上行同步)
1、rsync实时同步
(1)定期同步的不足
执行备份的时间固定,延迟明显,实时性差
当同步源长期不变时,密集的定期任务是不必要的
(2)实时同步的优点
一旦同步源出现变化,立即启动备份
只要同步源无变化,则不执行备份
2、Linux内核的inotify机制
从版本2.6.13开始提供
可以监控文件系统的变动情况,并做出通知响应
辅助软件:inotify-tools
使用 inotify 通知接口,可以用来监控文件系统的各种变化情况,如文件存取、删除、移动、修改等。利用这一机制,可以非常方便地实现文件异动告警、增量备份,并针对目录或文件的变化及时作出响应。
将inotify机制与 rsync 工具相结合,可以实现触发式备份(实时同步),即只要原始位置的文档发生变化,则立即启动增量备份操作,否则处于静默等待状态。这样,就避免了按固定周期备份时存在的延迟性、周期过密等问题。
因为 inotify 通知机制由 Linux 内核提供,因此主要做本机监控,在触发式备份中应用时更适合上行同步。
五、rsync+inotify实时同步(上行同步)配置
1、修改rsync源服务器配置文件
|
2、调整inotify内核参数
在Linux内核中,默认的inotify机制提供了三个调控参数∶max_queue_events(监控事件队列,默认值为16384)、max_user_instances(最多监控实例数,默认值为128)、max_user_watches(每个实例最多监控文件数,默认值为8192)。当要监控的目录、文件数量较多或者变化较频繁时,建议加大这三个参数的值
|
3、安装inotify-tools
|
4、执行inotifywait命令进行监控
|
选项 | 说明 |
-e | 用来指定要监控的事件 |
-m | 表示持续监控 |
-r | 表示递归整个目录 |
-q | 简化输出信息 |
5、编写触发式脚本(客户端)
|
6、查看上行结果
|
上述脚本用来检测本机/var/www/html目录的变动情况,一旦有更新触发rsync 同步操作,上传备份至服务器20.0.0.5 的 wwwroot 共享目录下。
触发式上行同步的验证过程如下∶
(1)在本机运行/opt/aaa.sh脚本程序
(2)切换到本机的 /var/www/html目录,执行增加、删除、修改文件等操作
(3)查看远端服务器中的 wwwroot目录下的变化情况
六、使用rsync来实现快速删除大量文件
假如要在Linux下删除大量文件,比如100万、1000万,像/usr/local/nginx/proxy_ temp的nginx缓存等,那么rm -rf *可能就不好使了,因为要等待很长一段时间。在这种情况下我们可以使用rsync来巧妙处理。rsync实际用的是替换原理
1、建立一个空的文件夹
|
2、用rsync删除目标目录
|
选项 | 说明 |
--delete-before | 接收者在传输之前进行删除操作 |
-a | 归档模式,表示以递归方式传输文件,并保持所有文件属性 |
-H | 保持硬连接的文件 |
-v | 详细输出模式 |
--progress | 在传输时显示传输过程 |
--stats | 给出某些文件的传输状态 |