Tokyo Cabinet 是日本人Mikio Hirabayashi 开发的一款DBM 数据库,该数据库读写非常快,哈希模式写入100 万条数据只需0.643 秒,读取100 万条数据只需0.773 秒,是Berkeley DB 等DBM 的几倍。
Tokyo Tyrant 是由同一作者开发的Tokyo Cabinet 数据库网络接口。它拥有Memcached兼容协议,也可以通过HTTP 协议进行数据交换。

Tokyo Tyrant 加上Tokyo Cabinet,构成了一款支持高并发的分布式持久存储系统,对任何原有Memcached 客户端来讲,可以将Tokyo Tyrant 看成是一个Memcached,但是,它的数据是可以持久存储的。


本文记录在linux上的安装过程:


1) 安装Tokyo Cabinet



    在安装Tokyo Tyrant之前,首先需要安装Tokyo Cabinet。



安装过程非常简单,标准流程如下:



gunzip tokyocabinet-1.4.45.tar.gz 

 

  tar xvf tokyocabinet-1.4.45.tar  

 

  cd tokyocabinet-1.4.45/ 

 

  ./configuration 

 

  make 

 

  make install



注意configuration时可能会发现缺少一些依赖包,需要自行安装。



2) 安装Tokyo Tyrant



    Tokyo Cabinet安装完成之后继续安装Tokyo Tyrant。安装过程同样简单,依然是标准流程:



tar xvf tokyocabinet-1.4.45.tar  

 

  cd tokyocabinet-1.4.45/ 

 

  ./configuration 

 

  make 

 

  make install



3) 启动



    启动tt最简单的方式,直接输入命令


 


    ttserver



    可以看到默认使用1978端口,监听所有地址。



    也可以指定端口与进程文件:

/home/openpf/app/tokyotyrant-1.1.41/bin/ttserver -port 9032 -pid /home/openpf/app/tokyotyrant-1.1.41/data/tt_account2/tt_9032.pid /home/openpf/app/tokyotyrant-1.1.41/data/tt_account2/tt_account2.tch


    对于Tokyo Tyrant的启动, 除了直接ttserver外,还有另外一个办法就是使用Tokyo Tyrant脚本。Tokyo Tyrant脚本默认地址为/usr/local/sbin/ttservctl,提供方便实用的命令如start / stop / restart / hup,最后还是调用ttserver. 



    至此,tt server安装完成,可以使用了。



4) 验证



    为了验证安装后的tt是否可以使用,我们可以做一些简单的验证。



    Tokyo Tyrant的安装包自带了一个检测工具,进入Tokyo Tyrant解压后的目录,执行make check


    可以看到有Writing Test / Reading Test / Removing Test / Random Concatenating Test / Miscellaneous Test / Wicked Writing Test / Typical Access Test / Threading Test 等多种测试方式被执行,并打印出测试结果。



5)测试


telnet 127.0.0.1 9032,如果顺利,你可以看到可以连通,键入stats然后回车,可以看到一些类似如下的状态信息。




Tokyo Tyrant(TTServer)介绍和安装 以及配置_数据库



请注意:在32位操作系统下,Tokyo Cabinet的单个数据库文件不能超过2G,而在64位操作系统下则没有这一限制。所以推荐使用64位操作系统和CPU。



启动参数介绍


        ttserver命令可以启动一个数据库实例。因为数据库已经实现了Tokyo Cabinet的抽象API,所以可以在启动的时候指定数据库的配置类型。


支持的数据库类型有:


  1. 内存hash数据库
  2. 内存tree数据库
  3. hash数据库
  4. B+ tree数据库

  命令通过下面的格式来使用,‘dbname’制定数据库名,如果省略,则被视作内存hash数据库。


ttserver [-host name] [-port num] [-thnum num] [-tout num] [-dmn] [-pid path] [-log path] [-ld|-le] [-ulog path] [-ulim num] [-uas] [-sidnum] [-mhost name] [-mport num] [-rts path] [-ext path] [-extpc name period] [-mask expr] [dbname]


下面来说这些参数的功能:


  • -host name :指明服务器的hostname或者ip地址。默认服务器的所有地址都会被绑定。比如:指定127.0.0.1这样的ip,就只是本地可以访问了。
  • -port num : 指定服务启动的端口. 默认1978.如果要启动多个数据库实例,端口需要不一样。
  • -thnum num : 指定服务工作的线程数。默认8.

-tout num

  • -dmn : 以守护进程方式运行。
  • -pid path : 输出进程IP到指定的文件。
  • -log path : 输出日志信息到指定文件。

-ld-le

  • -ulog path : 指定存放更新日志(update log)的目录.可以用来备份恢复数据库,主从库之间的同步。
  • -ulim num : 指定每个更新日志文件的大小限制.
  • -uas :使用异步IO记录更新日志。(使用此项可以减少写入日志的IO开销,但是在服务器意外关机,进程被kill时可能会丢失数据。根据经验,一般可以不使用)。
  • -sid num : 指定服务的ID号。主从复制的时候通过不同的ID号来识别。
  • -mhost name : 指定主从复制模式下的主服务器的IP或域名。
  • -mport num : 指定主从模式下主服务器的端口号.
  • -rts path : 指定用于主从复制的时间戳存放文件
  • -rcc 检查同步是否正常

-ext path-extpc name period-mask expr-unmask expr


数据库类型

  •    下面我们再来看下数据库类型的详细配置。
  1.     数据库名的命名方式被Tokyo Cabinet的抽象API指定。
  2.     如果数据库名为"*",表示内存hash数据库。
  3.     如果数据库名为"+"表示内存tree数据库。
  4.     如果数据库名为".tch",则数据库为hash数据库。
  5.     如果数据库名的后缀为".tcb",数据库将为B+ tree数据库。
  6.     如果数据库名的后缀为".tcf"。则数据库将为fixed-length数据库。
  7.     如果数据库名的后缀为".tct",则数据将为一个table数据库(有表的概念)。

数据库的调整参数通过数据库名的延伸来指定,通过"#"分开,每个参数通过一个参数名和值来指定,用"="隔开。






1、内存hash数据库支持"bnum", "capnum", 和 "capsiz"


2、 内存tree数据库支持"capnum" 和 "capsiz", capnum指定记录的最大容量,capsiz指定最大的内存使用量(在内存数据库中),记录通过存储的顺序移除。


3、hash数据库支持"mode", "bnum", "apow", "fpow", "opts", "rcnum", 和 "xmsiz". 


`rcnum'指定最大的缓存记录数。如果它不大于零,那么缓存记录不可用。默认不可用。
 xmsiz   指定外部内存的大小。如果不大于0,内存不可用。默认是67108864,即64M。
`bnum' 指定bucket存储桶的数量。如果指定的数目不大于0,将会使用默认的数值131071.推荐数量应该在所有需要存储的记录总数的0.4-4倍
`apow' 跟一个key关联的记录数,2的N次方表示.  如果不指定,默认2^4=16.
`fpow' specifies the maximum number of elements of the free block pool by power of 2.  默认2^10=1024.
`opts' 指定选项,位或:`HDBTLARGE' 指定数据库的大小通过使用64位数组桶能够超过2G。
                       `HDBTDEFLATE'  指定每个记录被Deflate encoding压缩。
                      `HDBTBZIP' 指定每个记录被BZIP2 encoding压缩

                       `HDBTTCBS'指定每个记录被 TCBS encoding压缩



4、B+ tree数据库支持"mode", "lmemb", "nmemb", "bnum", "apow", "fpow", "opts", "lcnum", "ncnum", 和 "xmsiz". 




5、Fixed-length 数据库 支持 "mode", "width", and "limsiz". 




6、Table 数据库支持 "mode", "bnum", "apow", "fpow", "opts", "rcnum", "lcnum", "ncnum", "xmsiz", 和 "idx"


      "idx"指定表的索引。


的mod为"wc"。




例如如下启动参数:


./ttserver -port 9032 -pid ~/app/tokyotyrant-1.1.41/data/tt_account2/tt_9032.pid ~/app/tokyotyrant-1.1.41/data/tt_account2/tt_account2.tch




通过Memcache协议使用ttserver


 通过telnet 127.0.0.1 9032 telnet连接到到启动的实例。


以下我们通过add增加key为key1和value为value1的数据。


<key> <flags> <exptime> <bytes>)



add key1 1 0 6


value1


STORED


get key1


VALUE key1 0 6


value1


END



编写php脚本


$mem=new Memcache();

$mem->connect("127.0.0.1",9032);

$mem->add("key2","xifeijian");

print_r( $mem->get("key2"));

echo "<br />";

$mem->add("key3",array("value3"=>"this is xifeijian"));

echo $mem->get("key3");

?>


运行后输出:(在服务器上直接执行php脚本,如果在浏览器中访问,效果就更加直观。)


 

Tokyo Tyrant(TTServer)介绍和安装 以及配置_数据库_02



Tokyo Tyrant(TTServer)介绍和安装 以及配置_数据库_03



需要注意的问题

序列化问题

   如果你熟悉memcache协议,或者你曾经用php的memcache来使用ttserver,你可能马上就发现了上面的问题。


比如我们key3是一个数组,但是我们取回来的是一个序列化的字符串,没有自动反序列化,在memcached服务器上是会自动反序列化的。


    通过上面的telnet示例我们可以看到,我们add key1的时候设置flag参数为1,但是我们get回来的时候,返回的flag参数是0,实际上,ttserver是没有存储flag参数的,统一的都使用0,这就造成了php使用时不会自动反序列化,当然,如果你使用压缩参数,一样会有这样的问题。


    怎么样解决这个问题,如果要修改ttserver的代码实为不方便。我们完全可以在php,或者我们的客户端来控制。


比如value我们统一的都序列化后存储,取出来的时候我们再反序列化。


自增问题


//使用ttserver自增

$mem=new Memcache();

$mem->connect("127.0.0.1",9032);

var_dump($mem->increment("incr"));

//结果为int(1)

?>


 


//使用memcache自增

$mem=new Memcache();

$mem->connect("127.0.0.1",9023);

var_dump($mem->increment("incr"));

//结果为bool(false)

?>


Memcache::increment()    does not