参考网址:RSync实现文件备份同步


我们在使用服务器发布我们的网站的时候,通常要考虑到文件的备份,而文件的备份比较高效的备份是增加备份,rsync软件就是这样的一个工具。为了实现多个服务器负载均衡,我们需要这几个服务器之间进行数据同步,而rsync软件也能胜任,下面我们来介绍如何架设rsync服务器来达到文件增量备份和数据同步的功能。

什么是rsync

rsync 是一个快速增量文件传输工具,它可以用于在同一主机备份内部的备分,我们还可以把它作为不同主机网络备份工具之用。本文主要讲述的是如何自架rsync服务器,以实现文件传输、备份和镜像。相对tar和wget来说,

rsync 也有其自身的优点,比如速度快、安全、高效。

rsync的安装

CentOS服务器,我们可以执行以下命令安装


    1. yum install rsync


    对于debian、ubuntu服务器,则是以下命令


      1. sudo apt-get  install  rsync


      rsync服务器的配置文件rsyncd.conf

      下面我们将涉及到三个文件 rsyncd.conf,rsyncd.secrets 和rsyncd.motd。
      rsyncd.conf 是rsync服务器主要配置文件。
      rsyncd.secrets是登录rsync服务器的密码文件。
      rsyncd.motd是定义rysnc 服务器信息的,也就是用户登录信息。

      下面我们分别建立这三个文件。


        1. mkdir /etc/rsyncd


        注:在/etc目录下创建一个rsyncd的目录,我们用来存放rsyncd.conf 和rsyncd.secrets文件;


          1. touch /etc/rsyncd/rsyncd.conf


          注:创建rsyncd.conf ,这是rsync服务器的配置文件;

          1. touch /etc/rsyncd/rsyncd.secrets

          注:创建rsyncd.secrets ,这是用户密码文件;


            1. chmod 600 /etc/rsyncd/rsyncd.secrets


            注:为了密码的安全性,我们把权限设为600;


              1. touch /etc/rsyncd/rsyncd.motd


              注:创建rsyncd.motd文件,这是定义服务器信息的文件。
              下一就是我们修改 rsyncd.conf 和rsyncd.secrets 和rsyncd.motd 文件的时候了。
              rsyncd.conf文件内容:

              1. # Minimal configuration file for rsync daemon
              2. # See rsync(1) and rsyncd.conf(5) man pages for help
              3.  
              4. # This line is required by the /etc/init.d/rsyncd script
              5. pid file = /var/run/rsyncd.pid   
              6. port = 873
              7. address = 192.168.1.171  
              8. #uid = nobody 
              9. #gid = nobody    
              10. uid = root   
              11. gid = root   
              12.  
              13. use chroot = yes  
              14. read only = no  
              15.  
              16.  
              17. #limit access to private LANs
              18. hosts allow=192.168.1.0/255.255.255.0 10.0.1.0/255.255.255.0 
              19. hosts deny=*
              20.  
              21. max connections = 5 
              22. motd file = /etc/rsyncd/rsyncd.motd
              23.  
              24. #This will give you a separate log file
              25. #log file = /var/log/rsync.log
              26.  
              27. #This will log every file transferred - up to 85,000+ per user, per sync
              28. #transfer logging = yes
              29.  
              30. log format = %t %a %m %f %b
              31. syslog facility = local3
              32. timeout = 300
              33.  
              34. [linuxsirhome]   
              35. path = /home    
              36. list=yes 
              37. ignore errors 
              38. auth users = linuxsir
              39. secrets file = /etc/rsyncd/rsyncd.secrets  
              40. comment = linuxsir home  
              41. exclude =   beinan/  samba/      
              42.  
              43. [beinan]
              44. path = /opt 
              45. list=no
              46. ignore errors
              47. comment = optdir   
              48. auth users = beinan
              49. secrets file = /etc/rsyncd/rsyncd.secrets


              密码文件:/etc/rsyncd/rsyncd.secrets的内容格式;


                1. 用户名:密码
                2. linuxsir:222222
                3. beinan:333333


                注: linuxsir是系统用户,这里的密码值得注意,为了安全,你不能把系统用户的密码写在这里。比如你的系统用户 linuxsir 密码是 abcdefg ,为了安全,你可以让rsync 中的linuxsir 为 222222 。这和samba的用户认证的密码原理是差不多的;
                rsyncd.motd 文件;
                它是定义rysnc 服务器信息的,也就是用户登录信息。比如让用户知道这个服务器是谁提供的等;类似ftp服务器登录时,我们所看到的 linuxsir.org ftp ……。 当然这在全局定义变量时,并不是必须的,你可以用#号注掉,或删除;我在这里写了一个 rsyncd.motd的内容为:

                1. +++++++++++++++++++++++++++
                2. + linuxsir.org  rsync  2002-2007 +
                3. +++++++++++++++++++++++++++


                rsyncd.conf文件代码说明

                1. pid file = /var/run/rsyncd.pid

                注:告诉进程写到 /var/run/rsyncd.pid 文件中;

                1. port = 873

                注:指定运行端口,默认是873,您可以自己指定;


                  1. address = 192.168.1.171


                  注:指定服务器IP地址;


                    1. uid = nobody
                    2. gid = nobdoy


                    注:服务器端传输文件时,要发哪个用户和用户组来执行,默认是nobody。 如果用nobody 用户和用户组,可能遇到权限问题,有些文件从服务器上拉不下来。所以我就偷懒,为了方便,用了root 。不过您可以在定义要同步的目录时定义的模块中指定用户来解决权限的问题。

                    1. use chroot = yes


                    用chroot,在传输文件之前,服务器守护程序在将chroot 到文件系统中的目录中,这样做的好处是可能保护系统被安装漏洞侵袭的可能。缺点是需要超级用户权限。另外对符号链接文件,将会排除在外。也就是说,你在rsync服务器上,如果有符号链接,你在备份服务器上运行客户端的同步数据时,只会把符号链接名同步下来,并不会同步符号链接的内容;这个需要自己来尝试;



                    1. read only = yes


                    注:read only 是只读选择,也就是说,不让客户端上传文件到服务器上。还有一个 write only选项,自己尝试是做什么用的吧;

                    1. #limit access to private LANs
                    2. hosts allow=192.168.1.0/255.255.255.0 10.0.1.0/255.255.255.0


                    注:在您可以指定单个IP,也可以指定整个网段,能提高安全性。格式是ip 与ip 之间、ip和网段之间、网段和网段之间要用空格隔开;

                    1. max connections = 5


                    注:客户端最多连接数;

                    1. motd file = /etc/rsyncd/rsyncd.motd


                    注:motd file 是定义服务器信息的,要自己写 rsyncd.motd 文件内容。当用户登录时会看到这个信息。


                      1. log file = /var/log/rsync.log


                      注:rsync 服务器的日志;


                        1. transfer logging = yes


                        注:这是传输文件的日志;



                        1. [linuxsirhome]


                        注:模块,它为我们提供了一个链接的名字,链接到哪呢,在本模块中,链接到了/home目录;要用[name] 形式;

                        1. path = /home


                        注:指定文件目录所在位置,这是必须指定的



                        1. auth users = linuxsir


                        注:认证用户是linuxsir ,是必须在

                        1. list=yes


                        注:list 意思是把rsync 服务器上提供同步数据的目录在服务器上模块是否显示列出来。默认是yes 。如果你不想列出来,就no ;如果是no是比较安全的,至少别人不知道你的服务器上提供了哪些目录。你自己知道就行了;

                        1. ignore errors

                        注:忽略IO错误,详细的请查文档;


                          1. secrets file = /etc/rsyncd/rsyncd.secrets


                          注:密码存在哪个文件;



                          1. comment = linuxsir home  data

                          注:注释可以自己定义,写什么都行,写点相关的内容就行;


                            1. exclude =   beinan/   samba/


                            注:exclude 是排除的意思,也就是说,要把/home目录下的beinan和samba 排除在外; beinan/和samba/目录之间有空格分开 ;

                            启动rsync 服务器及防火墙的设置

                            启动rsync服务器
                            启动rsync 服务器相当简单,–daemon 是让rsync 以服务器模式运行;

                            1. /usr/bin/rsync --daemon  --config=/etc/rsyncd/rsyncd.conf

                            rsync服务器和防火墙
                            Linux 防火墙是用iptables,所以我们至少在服务器端要让你所定义的rsync 服务器端口通过,客户端上也应该让通过。

                            1. iptables -A INPUT -p tcp -m state --state NEW  -m tcp --dport 873 -j ACCEPT

                            查看一下防火墙是不是打开了 873端口;



                            1. iptables -L


                            通过rsync客户端来同步数据

                            1. rsync -avzP linuxsir@linuxsir.org::linuxsirhome   linuxsirhome

                            Password: 这里要输入linuxsir的密码,是服务器端提供的,在前面的例子中,我们用的是 222222,输入的密码并不显示出来;输好后就回车;
                            注: 这个命令的意思就是说,用linuxsir 用户登录到服务器上,把linuxsirhome数据,同步到本地目录linuxsirhome上。当然本地的目录是可以你自己定义的,比如 linuxsir也是可以的;当你在客户端上,当前操作的目录下没有linuxsirhome这个目录时,系统会自动为你创建一个;当存在linuxsirhome这个目录中,你要注意它的写权限。
                            说明:
                            -a 参数,相当于-rlptgoD,-r 是递归 -l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件;
                            -z 传输时压缩;
                            -P 传输进度;
                            -v 传输时的进度等信息,和-P有点关系,自己试试。可以看文档;

                            1. rsync -avzP  --delete linuxsir@linuxsir.org::linuxsirhome   linuxsirhome

                            这回我们引入一个 –delete 选项,表示客户端上的数据要与服务器端完全一致,如果 linuxsirhome目录中有服务器上不存在的文件,则删除。最终目的是让linuxsirhome目录上的数据完全与服务器上保持一致;用的时候要小心点,最好不要把已经有重要数所据的目录,当做本地更新目录,否则会把你的数据全部删除;


                              1. rsync -avzP  --delete  --password-file=rsync.password  linuxsir@linuxsir.org::linuxsirhome   linuxsirhome


                              这次我们加了一个选项 –password-file=rsync.password ,这是当我们以linuxsir用户登录rsync服务器同步数据时,密码将读取 rsync.password 这个文件。这个文件内容只是linuxsir用户的密码。我们要如下做;


                                1. touch rsync.password
                                2. chmod 600 rsync.password
                                3. echo "222222"> rsync.password
                                4. rsync -avzP  --delete  --password-file=rsync.password  linuxsir@linuxsir.org::linuxsirhome   linuxsirhome


                                注: 这样就不需要密码了;其实这是比较重要的,因为服务器通过crond 计划任务还是有必要的;

                                让rsync 客户端自动与服务器同步数据

                                编辑crontab crontab -e
                                加入如下代码:

                                1. 10 0 * * * rsync -avzP  --delete  --password-file=rsync.password  linuxsir@linuxsir.org::linuxsirhome   linuxsirhome

                                表示每天0点10分执行后面的命令。更多crontab用法请参考


                                ########################################################################

                                rsync的完整参数说明:
                                -v, --verbose 详细模式输出
                                -q, --quiet 精简输出模式
                                -c, --checksum 打开校验开关,强制对文件传输进行校验
                                -a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
                                -r, --recursive 对子目录以递归模式处理
                                -R, --relative 使用相对路径信息
                                -b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
                                --backup-dir 将备份文件(如~filename)存放在在目录下。
                                -suffix=SUFFIX 定义备份文件前缀
                                -u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
                                -l, --links 保留软链结
                                -L, --copy-links 想对待常规文件一样处理软链结
                                --copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
                                --safe-links 忽略指向SRC路径目录树以外的链结
                                -H, --hard-links 保留硬链结
                                -p, --perms 保持文件权限
                                -o, --owner 保持文件属主信息
                                -g, --group 保持文件属组信息
                                -D, --devices 保持设备文件信息
                                -t, --times 保持文件时间信息
                                -S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
                                -n, --dry-run现实哪些文件将被传输
                                -W, --whole-file 拷贝文件,不进行增量检测
                                -x, --one-file-system 不要跨越文件系统边界
                                -B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
                                -e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
                                --rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
                                -C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
                                --existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
                                --delete 删除那些DST中SRC没有的文件
                                --delete-excluded 同样删除接收端那些被该选项指定排除的文件
                                --delete-after 传输结束以后再删除
                                --ignore-errors 及时出现IO错误也进行删除
                                --max-delete=NUM 最多删除NUM个文件
                                --partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
                                --force 强制删除目录,即使不为空
                                --numeric-ids 不将数字的用户和组ID匹配为用户名和组名
                                --timeout=TIME IP超时时间,单位为秒
                                -I, --ignore-times 不跳过那些有同样的时间和长度的文件
                                --size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
                                --modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
                                -T --temp-dir=DIR 在DIR中创建临时文件
                                --compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
                                -P 等同于 --partial
                                --progress 显示备份过程
                                -z, --compress 对备份的文件在传输时进行压缩处理
                                --exclude=PATTERN 指定排除不需要传输的文件模式
                                --include=PATTERN 指定不排除而需要传输的文件模式
                                --exclude-from=FILE 排除FILE中指定模式的文件
                                --include-from=FILE 不排除FILE指定模式匹配的文件
                                --version 打印版本信息
                                --address 绑定到特定的地址
                                --config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
                                --port=PORT 指定其他的rsync服务端口
                                --blocking-io 对远程shell使用阻塞IO
                                -stats 给出某些文件的传输状态
                                --progress 在传输时现实传输过程
                                --log-format=formAT 指定日志文件格式
                                --password-file=FILE 从FILE中得到密码
                                --bwlimit=KBPS 限制I/O带宽,KBytes per second
                                -h, --help 显示帮助信息
                                要排除同步某个目录时,为rsync添加--exculde=PATTERN参数,注意,路径是相对路径,具体查看man rsync。
                                要排除某个目录的事件监听的处理时,为inotifywait添加--exclude或--excludei参数,具体查看man inotifywait。