第十章   文本数据库

10.1  概述

       Openss实现了一个简单的文本数据库,它可以从文件读取数据和将数据写到文件中,并且可以根据关键字段来查询数据。Openssl的文本数据库供apps/目录下的文件调用,比如apps.c、ca.c和ocsp.c。openssl文本数据库典型的例子为apps/demoCA/index.txt。文本数据库一行代表数据库的一行,各个列之间必须用一个\t隔开,用#进行注释(#必须在开始位置),以空行结束。比如下面的例子:

赵春平    28    湖北

       zcp  28    荆门

       文本数据库的查找用到了哈希表。openssl读取的所有行数据存放在堆栈中,并为每一列数据建立一个单独的哈希表。每个哈希表中存放了所有行数据的地址。查询时,用户指定某一列,openssl根据对应的哈希表进行查找。

10.2  数据结构

       数据结构在crypto/txt_db/txt_db.h中定义,如下:

  

typedef struct txt_db_st
        {
               int num_fields;
               STACK *data;
               LHASH **index;
               int (**qual)(char **);
               long error;
               long arg1;
               long arg2;
               char **arg_row;
        } TXT_DB;

       意义如下:

       num_fields:表明文本数据库的列数。

data:用来存放数据,每一行数据组织成为一个字符串数组(每个数组值对应该行的一列),  并将此数组地址push到堆栈中。

index:哈希表数组,每一列对应一个哈希表。每一列都可以建哈希表,如果不建哈希表将不能查找该列数据。

qual:一个函数地址数组,数组的每个元素对应一列,进行插入该列哈希表前的过滤。这些函数用于判断一行数据的一列或者多列是否满足某种条件,如果满足将不能插入到哈希表中去(但是能存入堆栈)。每一列都可以设置一个这样的函数。这些函数由用户实现。比如,一个文本数据库中,有名字列和年龄列,并且要求名字长度不能小于2,年龄不能小于0和大于200。用户为名字列实现了一个qual函数,只用来检查名字长度,对于年龄列实现一个qual函数,只用来检查年龄。当用户要插入一条记录,名字长度为1,但是年龄合法,那么该记录能插入到年龄列对应的哈希表中,而不能插入名字列对应的哈希表。

error、arg1、arg2和arg_row用于存放错误信息。

10.3  函数说明

1)  TXT_DB *TXT_DB_read(BIO *in, int num)

用于从BIO中读入数据,转换为TXT_DB,num用于明确指明列数,本函数不建立哈希表。

2)  long TXT_DB_write(BIO *out, TXT_DB *db)

              将TXT_DB内容写入BIO;

3)  int TXT_DB_create_index(TXT_DB *db,int field,int (*qual)(char **),

              LHASH_HASH_FN_TYPE hash, LHASH_COMP_FN_TYPE cmp)

给field指定的列建立哈希表。db为需要建索引的TXT_DB,hash为一行数据的hash运算回调函数,cmp为一行数据的比较函数。

4)  char **TXT_DB_get_by_index(TXT_DB *db, int idx, char **value)

根据关键字段来查询数据,查询结果返回一行数据db为文本数据库,idx表明采用哪一列的哈希表来查找;value为查询条件。

5)  int TXT_DB_insert(TXT_DB *db,char **value)

              往TXT_DB中插入一行数据。value数组以NULL表示结束。

6)    void TXT_DB_free(TXT_DB *db)

              清除TXT_DB。

10.4  编程示例

   

/* txtdb.dat的内容
        赵春平    28    湖北       无
        zcp  28    荆门       无
        */
        #include <openssl/bio.h>
        #include <openssl/txt_db.h>
        #include <openssl/lhash.h>
       
        /* 名字过滤 */
        static       int    name_filter(char **in)
        {
               if(strlen(in[0])<2)
                      return 0;
               return 1;
        }
  
        static unsigned long index_name_hash(const char **a)
        {
               const char *n;
       
             n=a[0];
             while (*n == '0') n++;
             return(lh_strhash(n));
        }
       
        static int index_name_cmp(const char **a, const char **b)
        {
               const char *aa,*bb;
       
               for (aa=a[0]; *aa == '0'; aa++);
               for (bb=b[0]; *bb == '0'; bb++);
               return(strcmp(aa,bb));
        }
       
        int    main()
        {
               TXT_DB        *db=NULL,*out=NULL;
               BIO               *in;
               int                  num,ret;
               char        **added=NULL,**rrow=0,**row=NULL;
       
               in=BIO_new_file("txtdb.dat","r");
               num=1024;
               db=TXT_DB_read(in,4);
       
               added=(char **)OPENSSL_malloc(sizeof(char *)*(3+1));
                   added[0]=(char *)OPENSSL_malloc(10);
               #if 1
               strcpy(added[0],"skp");
               #else
               strcpy(added[0],"a");     /* 不能插入名字对应的哈希表 */
               #endif
              
               added[1]=(char *)OPENSSL_malloc(10);
               strcpy(added[1],"22");
       
               added[2]=(char *)OPENSSL_malloc(10);
               strcpy(added[2],"chairman");
           
               added[3]=NULL;
       
               ret=TXT_DB_insert(db,added);
               if(ret!=1)
               {
                      printf("err!\n");
                      return -1;
               }
               ret=TXT_DB_create_index(db,0, name_filter,index_name_hash,index_name_cmp);
               if(ret!=1)
               {
                      printf("err\n");
                      return 0;
               }
               row=(char **)malloc(2*sizeof(char *));
                   row[0]=(char *)malloc(10);
               strcpy(row[0],"skp");
               row[1]=NULL;
               rrow=TXT_DB_get_by_index(db,0,row);
               if(rrow!=NULL)
                      printf("%s      %s   %s\n",rrow[0],rrow[1],rrow[2]);
               out=BIO_new_file("txtdb2.dat","w");
               ret=TXT_DB_write(out,db);
               TXT_DB_free(db);
               BIO_free(in);
               BIO_free(out);
               return 0;
        }

       本示例只对第一列做了哈希。需要注意的是,added数组及其元素申请空间时尽量采用OPENSSL_malloc而不是malloc,且其申请的空间由TXT_DB_free(调用OPENSSL_free)释放。