手机搜索设计备忘录 

 

我们要在手机上做一个搜索的应用程序,它支持在名片、邮件、短信和文件系统等不同的数据源中搜索。和普通的桌面搜索相比,它的功能相对弱小,不支持组合查询,只支持简单的正则表达式查询。尽管如此,这个应用程序还是很实用的。前段时间大概想一下实现它的方法,最近和负责该模块的同事做了简短讨论,这里做个备忘。

 

先声明一下,本文不涉及任何复杂的搜索算法,主要考虑应用程序的架构设计。

 

几点设计考虑:

l         不支持全文搜索。主要考虑是,我们对全文搜索不熟悉,评估和移植lucene可能有些困难。而且目前lucene似乎只有java/c#两种版本,C语言版本没有完成。更重要的是在手机不需要那么强大的功能,简单的正则表达式匹配就差不多了。但在设计时,我们仍然考虑了可扩展性,以后支持全文搜索也比较简单。

 

l         分类查询。让用户选择查询的范围。是在短信中查询,还是在文件系统中查询,或者在整个手机范围内查询,这是由用户指定的。如果用户知道信息的大概范围,就可以避免不必要的时间浪费。

 

应用程序的基本架构:

 

手机搜索设计备忘录_lucene

ISearchEngine接口。这是每类搜索引擎都要实现的接口。文件是在文件系统中的,短信和名片是在数据库中的,后两者的数据表结构也相差很大,所以每一类信息的搜索方式都不一样,这要实现不同的搜索引擎。但对于应用程序框架来说,它只关心ISearchEngine接口。

 

搜索引擎都以共享库的方式提供,在共享库里实现一个create_search_engine的函数,用来创建ISearchEngine接口的实现,这些共享库要安装到指定的目录中。搜索应用程序在起动时扫描该目录,加载所有的搜索引擎。ISearchEngine的主要接口函数有:

1.         get_name。获取ISearchEngine的名称,用来显示在列表中,让用户可以选择。

2.         search。查询指定的字符串。如果search查询完成时才返回结果,可能会让用户等待太久。所以由调用者提供一个回调函数,每搜索到一条,立即调用回调函数,把搜索结果显示出来。

3.         destroy。释放该ISearchEngine

 

ISearchResult接口。它是一条搜索结果的抽象。搜索结果固然可以作为一个单纯的数据对象存在,但考虑到它有自己的行为,比如,起动对应的应用程序查看该记录。同时也考虑到延迟加载的问题,通过接口函数去获取搜索结果信息,让延迟加载成为可能。ISearchResult的主要接口函数有:

1.         get_icon,得到显示的icon,用来区分不同的数据源。

2.         get_abstract,得到摘要信息,用来显示在列表中。

3.         view,起动应用程序查看完整信息。比如用短信应用程序打开短信,用名片应用程序打开名片,用邮件应用程序打开邮件等等。

4.         destroy。释放该ISearchResult

 

搜索的流程如下:

1.         用户输入搜索内容并选择搜索类别。

2.         应用程序调用所选类别ISearchEnginesearch函数。

3.         ISearchEngine搜索。

4.         应用程序把搜索结果显示在列表中。

5.         用户查看某条搜索结果。

6.         应用程序调用ISearchResultview函数。

7.         ISearchResultview函数通常是起动对应的应用程序。

 

ISearchEngine的实现:

1.         对于像名片、短信和日程这类存放在数据库中的数据源,实现比较简单。我们采用的sqlite3作为数据库管理系统,通过SQL语句就可以实现搜索。

2.         对文件内容的搜索,实现要麻烦一点。如果是文本文件,可以直接调用grep去完成搜索。而对于二进制文件,比如tarpdf之类的文件,要分析它的格式才能查询,暂时不考虑,等有时间了再做。

3.         对于搜索结果。每条搜索结果要保存一个path,用以标识它的位置。对于数据库搜索结果,path是表名+ID,对于文件搜索结果,path是完整文件名+偏移量。

 

按照以上设计,应用程序只是一个框架,ISearchEngine作为插件加入到框架中运行。新增搜索引擎时,不必修改应用程序本身。

 

~~end~~