最近想把公司原来用CVS管理的代码迁移到SVN中去。主要是因为SVN是整个版本库共享一个版本历史,比较方便完整的Checkout某个工程。而且SVN还有一些CVS所不具有的良好特性,比如支持对目录版本进行管理,支持重命名和移动等。

  上网查了下,大部分人用cvs2svn来将CVS版本库迁移到SVN中。但是cvs2svn似乎要用Python来运行,我向来不太喜欢Python的语法,所以希望能找到其它方案。最后发现SVN Importer。SVN Importer不仅可以进行CVS版本库到SVN版本库的迁移,而且还可以迁移PVCS、VSS、ClearCase、MKS、StarTeam等VCS(Version Control System,版本管理系统)的版本库到SVN。

  大家去Subversion主页的时候,通常都是直接去的www.subversion.org(subversion.tigris.org)。其实Subversion还有另一个主页www.subversion.com。.COM站我去得少,却没想到一进去最明显的那个位置就是SVN Importer。这个工具是用Java实现的,需要JRE来运行。而且,由于SVN Importer几乎都是使用源VCS自带的命令行工具来导出数据,所以需要安装源VCS。另外,SVN Importer向SVN导入数据的时候,用的是Subversion的svnadmin,所以还需要安装Subversion。

  SVN Importer有两种方案来迁移CVS的版本库。
  1. 使用SVN Importer内置的Java CVS通过pserver协议来导出数据;
  2. 使用RCS直接从CVS版本库文件系统中导出数据。

  数据迁移过程分三步。和其它工具类似,都是读数据、生成DUMP、导入DUMP。整个过程及参数配置都在文档里写得比较详细。文档目前只有英文的,不过目前Subversion中文站(www.subversion.org.cn)正在翻译SVN Importer的文档,相信中文文档不久就会面世。顺便打个广告——请有兴趣翻译的朋友与subversion.org.cn站长联系(http://www.subversion.org.cn/index.php?option=com_contact&Itemid=3),申请加入翻译队伍。

  中文文档出台之前,总不能就不用SVN Importer吧,所以我就根据个人经验简单的介绍下吧。

  SVN Importer的安装和运行很简单。下载之后解压到某个目录即完成安装。安装目录下有一个run.bat文件。运行run.bat的时候要带2-3个参数。第一个参数是操作模式;第二个参数是配置文件;第三个参数指定一个日期,表示仅迁移这个日期之后的数据。

  SVN Importer有3种操作模式:完整、增量和列表。完整模式用于将源VCS的版本库数据全部导出;增量模式则用在第一次的完整模式之后,导出新增加的数据;列表模式只将要导出的数据显示出来,不实际导出。

  至于配置文件,在安装目录下已经有一个config.properties作为示例。使用SVN Importer的时候只需要复制一份这个文件,再稍做修改即可。

  配置文件中主要分四个部分:
  第一部分,常规配置,这里选择源版本库,设置临时目录,以及中间文件的位置等。重要的一些设置如下:

srcprovider=源VCS,可以是cvs、cvsrcs、pvcs、vss、cc、mks等
import_dump_into_svn=yes或no,是否在生成DUMP文件之后立即导入SVN中(选否则不导入)
full.dump.file=完整模式时生成的DUMP文件路径
incr.dump.file=增量模式时生成的DUMP文件路径
incr.history.file=历史文件路径,这个文件在第一次完整模式时生成,以后使用增量模式时需要读取其内容。

  第二部分是SVN相关的设置,主要包括svnadmin的位置和版本库中的一些设置。关键设置如下:

trunk_path=/trunk,主分支所在目录
branches_path=/branches,分支目录
tags_path=/tags,标签保存目录
svnimporter_user_name=SvnImporter,创建版本库的用户名
svnadmin.executable=svnadmin的路径
svnadmin.repository_path=产生的SVN版本库路径
svnadmin.parent_dir=将数据导入版本库里的哪们目录。想设置为根目录,将这个值设置为.(点号)即可;或者可以设置成工程名。trunk、branches和tags都会产生在这个目录之下。

  第三部分是对所选择的源VCS进行配置,用于导出数据。因为工作中只是为了迁移CVS的数据,所以只用到了导出CVS的两种配置。稍后说明。

  第四部分是对日志文件的一些配置。

  第一次是直接使用的srcprovider=cvs,通过pserver来导出数据。想对于cvsrcs来说,这个速度要稍慢一些,但是它不需要安装第三方的工具,只需要使用内置的Java CVS就行,所以用来导出小项目还是比较好的。而且配置也比较简单,主要就是CVSROOT中的一些配置。

cvs.class=org.polarion.svnimporter.cvsprovider.CvsProvider
cvs.username=访问CVS版本库的用户名
cvs.password=上面用户名登录CVS版本库时的密码
cvs.hostname=主机地址
cvs.repository=CVSROOT目录
cvs.modulename=要导出的工程(或目录)
cvs.tempdir=存放临时文件的目录

  后来考虑到CVS里面的工程都比较大,而且可能需要直接从版本库文件导出数据(不是通过客户端去访问CVS版本库,而直接访问版库的文件),所以又尝试了使用srcprovider=cvsrcs。这个情况下要用GNU RCS来导出CVS数据,所以需要安装RCS(http://www.gnu.org/software/rcs/rcs.html)。

  RCS目前最新是5.7版,分3个包下载,分别是rcs57pc1、rcs57pc2和rcs57pc3。这3个文件包分别是编译好的二进制文件、文档和源码。其实只需要下载第一个包就行了,需要用到的也只是bin目录下的rlog和co两个命令而已。相关配置大概有:

cvsrcs.class=org.polarion.svnimporter.cvsprovider.CvsRcsProvider
cvsrcs.repository_path=CVS版库文件目录
cvsrcs.rlog_command=rlog命令的路径
cvsrcs.co_command=co命令的路径
cvsrcs.tempdir=保存临时文件的目录

  配置好之后,一开始每次运行都失败,看日志也不知所云。大概是说某个文件没找到。于是决定手工运行rlog.exe来试试看。

rlog.exe cvsroot/common/common.sln,v

  结果报错

rlog: cvsroot/common/RCS/common.sln,v: No such file or directory

  很奇怪,为什么rlog非要塞一个RCS/目录进去呢?后来在论坛上查到,使用cvsrcs的时候,需要设置环境变量RCSINIT=-x,v/,虽然看不明白是啥意思,不过设置了这个环境变量之后SVN Importer跑成功了。

  为了搞明白这个设置,所以只好去下载了RCS的文档来查看。在文档里搜索-x,v/,发现原来是配置RCS处理的文件后缀。未设置的情况下会去RCS子目录中查找文件。-x是设置后缀的参数,v是CVS版本库文件的后缀,而/是分隔符,其后没有东西表示为空。所以这个设置是兼顾,v文件和RCS/两种情况。

  最后,由于CVS不能记录目录的更改历史,最后导入到SVN后,从HEAD里取出来的数据中有许多原来删除掉的目录和文件。感觉多冒出来的那些都应该是些空目录才对,搞不明白为什么还有一些删除掉的文件也冒出来了,还不太好找规律。所以,只好先对照从CVS里Checkout出来的最新版,删除掉多余的目录和文件之后,再Checkin到SVN中,这才算完成迁移过程。