备份数据的重要性和必要性
为啥需要进行数据备份
我们需要对一些比较重要的数据进行备份,防止数据的丢失
数据备份的方式
- 全量备份 --- 会将所有的数据进行备份,效率比较低下
- 增量备份 --- 只是将变动的数据进行备份,效率比较高,并且适合进行异地备份
数据备份的工具
- scp:网络之间的拷贝,全量的拷贝方式,不推荐
- rsync:远程增量备份工具
rsync的介绍
rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。
rsync的工作原理和场景
- 推:所有主机推送本地数据到Rsync备份服务器,会导致数据同步缓慢(适合少量的数据备份)
- 拉:rsync备份服务端拉取所有主机上的数据,会导致备份服务器开销过大
- rsync大数据量备份
- rsync异地数据备份
rsync数据传输方式
主要分成三种方式:
- 本地传输 (类似于cp命令)
- 远程传输(从a主机 ----> b主机)
- 守护进程 (运行一个程序在后台)
rsync的参数介绍
rsync参数:-avz
-a #归档模式传输, 等于-tropgDl
-v #详细模式输出, 打印速率, 文件数量等
-z #传输时进行压缩以提高效率
-r #递归传输目录及子目录,即目录下得所有目录都同样传输。
-t #保持文件时间信息
-o #保持文件属主信息
-p #保持文件权限
-g #保持文件属组信息
-l #保留软连接
-P #显示同步的过程及传输时的进度等信息
-D #保持设备文件信息
-L #保留软连接指向的目标文件
-e #使用的信道协议,指定替代rsh的shell程序 ssh
--exclude=PATTERN #指定排除不需要传输的文件模式
--exclude-from=file #文件名所在的目录文件
--bwlimit=100 #限速传输
--partial #断点续传
--delete #让目标目录和源目录数据保持一致
注意:一般我们只需要使用avz这三个参数即可
本地传输
由于本地传输,我们一般用cp就可以了,所以本地传输使用rsync大材小用
远程传输
1.推送方式
废话不多说,直接看例子
rsync -avz anaconda-ks.cfg root@192.168.79.1:/tmp
将本地的 anaconda-ks.cfg 文件,推送到192.168.79.1的tmp目录下面,使用的是root身份推送
2.拉取方式
rsync -avz root@192.168.79.1:/tmp/services ./
将远程服务器192.168.79.1的tmp目录下面的services,拉取到当前目录下面
但是上述传输方式存在两个问题:
1.使用系统用户(不安全) 2.使用普通用户(会导致权限不足情况)
因此,接下来,我们使用后台进程的方式,来进行文件的传输:
后台服务进程方式
具体的命令格式如下:
下载 Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST]
上传 Push: rsync [OPTION...] SRC... [USER@]HOST::DEST
在使用上述命令格式之前,我们需要进行前期的配置,如下:
a.先来看一下实验环境:
主机角色 外网IP(NAT) 内网IP(LAN) 主机名称
Rsync服务端 10.0.0.41 172.16.1.41 backup
Rsync客户端 10.0.0.31 172.16.1.31 nfs
b.需要在服务端安装rsyncd服务
yum install rsync -y
c.配置服务
[root@backup ~]# rpm -qc rsync
/etc/rsyncd.conf # 主配置文件
/etc/sysconfig/rsyncd # 选项
[root@backup ~]# vim /etc/rsyncd.conf
uid = rsync # 运行进程的用户
gid = rsync # 运行进程的用户组
port = 873 # 监听端口
fake super = yes # 无需让rsync以root身份运行,允许接收文件的完整属性
use chroot = no # 禁锢推送的数据至某个目录, 不允许跳出该目录
max connections = 200 # 最大连接数
timeout = 600 # 超时时间
ignore errors # 忽略错误信息
read only = false # 对备份数据可读写
list = false # 不允许查看模块信息
auth users = rsync_backup # 定义虚拟用户,作为连接认证用户
secrets file = /etc/rsync.passwd # 定义rsync服务用户连接认证密码文件路径
[backup] # 定义模块信息
comment = commit # 模块注释信息
path = /backup # 定义接收备份数据目录
c.创建rsync进程启动时需要使用的用户
[root@backup ~]# useradd rsync -M -s /sbin/nologin
[root@backup ~]# id rsync
uid=1000(rsync) gid=1000(rsync) groups=1000(rsync)
d.创建密码文件,在密码文件中写入对应的虚拟用户以及虚拟用户的密码
/etc/rsync.passwd---》rsync虚拟用户以及rsync虚拟用户的密码
[root@backup ~]# echo "rsync_backup:123456" > /etc/rsync.passwd
[root@backup ~]# chmod 600 /etc/rsync.passwd
e.创建存储备份数据的目录,并进行授权
[root@backup ~]# mkdir /backup
[root@backup ~]# chown -R rsync.rsync /backup/
f.启动rsync服务并加入开机自启动
[root@backup ~]# systemctl start rsyncd.service
[root@backup ~]# systemctl enable rsyncd
检查rsync的873端口是否存在
[root@backup ~]# netstat -lntp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 11129/rsync
g.客户端开始进行测试
客户端nfs推送(注意加/ 和不加/的区别)
[root@nfs ~]# rsync -avz /etc/ rsync_backup@172.16.1.41::backup #推送/etc/下面的内容
[root@nfs ~]# rsync -avz /etc rsync_backup@172.16.1.41::backup #推送/etc这个目录
客户端拉取
[root@nfs ~]# rsync -avz rsync_backup@172.16.1.41::backup /opt
拉取服务端172.16.1.41的backup目录下面的所有内容至本地的 /opt目录
在上述过程中,我们需要注意下面几点:
注意事项:
rsync_backup:客户端通过该虚拟用户连接rsync服务
是一个虚拟用户,由服务端的配置文件中定义【auth users】
通常存放在指定的一个文件中,该文件也是有服务端配置文件定义【secrets file】rsync:【模块对应的目录,必须授权为配置文件中定义的uid和gid的用户】
用于运行rsync服务时需要使用到的系统用户
用于将接收到的数据以自己的身份写入到对应的目录中
到此,使用后台进程的方式配置完成
rsync实现客户端与服务端无差异同步
简单点说,就是在客户端这边删除了文件的话,则服务端同步的那个文件也会被删掉
具体实现的命令:
#推送方式实现无差异,以客户端为准,客户端有什么服务端就有什么
[root@nfs ~]# rsync -avz --delete /root rsync_backup@172.16.1.41::backup
#拉取方式实现无差异,以服务端为准,服务端有什么客户端就有什么
[root@nfs ~]# rsync -avz --delete rsync_backup@172.16.1.41::backup /opt/
rsync 传输的时候限速
有的时候,我们传输文件会占满整个带宽,因此,为了避免这种情况,我们会对传输的速度进行限制
具体实现的命令如下:
对传输时候进行限速:
[root@nfs ~]# dd if=/dev/zero of=./size.disk bs=1M count=500 生成大文件
限制传输的速率为1MB
[root@nfs ~]# rsync -avzP --bwlimit=1 ./size.disk rsync_backup@172.16.1.41::backup
Password:
sending incremental file list
size.disk
118,358,016 22% 1.01MB/s 0:06:33
上述中,--bwlimit
代表的就是限速,单位是MB/S
非学,无以致疑;非问,无以广识