手机搜索设计备忘录
我们要在手机上做一个搜索的应用程序,它支持在名片、邮件、短信和文件系统等不同的数据源中搜索。和普通的桌面搜索相比,它的功能相对弱小,不支持组合查询,只支持简单的正则表达式查询。尽管如此,这个应用程序还是很实用的。前段时间大概想一下实现它的方法,最近和负责该模块的同事做了简短讨论,这里做个备忘。
先声明一下,本文不涉及任何复杂的搜索算法,主要考虑应用程序的架构设计。
几点设计考虑:
l 不支持全文搜索。主要考虑是,我们对全文搜索不熟悉,评估和移植lucene可能有些困难。而且目前lucene似乎只有java/c#两种版本,C语言版本没有完成。更重要的是在手机不需要那么强大的功能,简单的正则表达式匹配就差不多了。但在设计时,我们仍然考虑了可扩展性,以后支持全文搜索也比较简单。
l 分类查询。让用户选择查询的范围。是在短信中查询,还是在文件系统中查询,或者在整个手机范围内查询,这是由用户指定的。如果用户知道信息的大概范围,就可以避免不必要的时间浪费。
应用程序的基本架构:
ISearchEngine接口。这是每类搜索引擎都要实现的接口。文件是在文件系统中的,短信和名片是在数据库中的,后两者的数据表结构也相差很大,所以每一类信息的搜索方式都不一样,这要实现不同的搜索引擎。但对于应用程序框架来说,它只关心ISearchEngine接口。
搜索引擎都以共享库的方式提供,在共享库里实现一个create_search_engine的函数,用来创建ISearchEngine接口的实现,这些共享库要安装到指定的目录中。搜索应用程序在起动时扫描该目录,加载所有的搜索引擎。ISearchEngine的主要接口函数有:
1. get_name。获取ISearchEngine的名称,用来显示在列表中,让用户可以选择。
2. search。查询指定的字符串。如果search查询完成时才返回结果,可能会让用户等待太久。所以由调用者提供一个回调函数,每搜索到一条,立即调用回调函数,把搜索结果显示出来。
3. destroy。释放该ISearchEngine。
ISearchResult接口。它是一条搜索结果的抽象。搜索结果固然可以作为一个单纯的数据对象存在,但考虑到它有自己的行为,比如,起动对应的应用程序查看该记录。同时也考虑到延迟加载的问题,通过接口函数去获取搜索结果信息,让延迟加载成为可能。ISearchResult的主要接口函数有:
1. get_icon,得到显示的icon,用来区分不同的数据源。
2. get_abstract,得到摘要信息,用来显示在列表中。
3. view,起动应用程序查看完整信息。比如用短信应用程序打开短信,用名片应用程序打开名片,用邮件应用程序打开邮件等等。
4. destroy。释放该ISearchResult。
搜索的流程如下:
1. 用户输入搜索内容并选择搜索类别。
2. 应用程序调用所选类别ISearchEngine的search函数。
3. ISearchEngine搜索。
4. 应用程序把搜索结果显示在列表中。
5. 用户查看某条搜索结果。
6. 应用程序调用ISearchResult的view函数。
7. ISearchResult的view函数通常是起动对应的应用程序。
ISearchEngine的实现:
1. 对于像名片、短信和日程这类存放在数据库中的数据源,实现比较简单。我们采用的sqlite3作为数据库管理系统,通过SQL语句就可以实现搜索。
2. 对文件内容的搜索,实现要麻烦一点。如果是文本文件,可以直接调用grep去完成搜索。而对于二进制文件,比如tar和pdf之类的文件,要分析它的格式才能查询,暂时不考虑,等有时间了再做。
3. 对于搜索结果。每条搜索结果要保存一个path,用以标识它的位置。对于数据库搜索结果,path是表名+ID,对于文件搜索结果,path是完整文件名+偏移量。
按照以上设计,应用程序只是一个框架,ISearchEngine作为插件加入到框架中运行。新增搜索引擎时,不必修改应用程序本身。
~~end~~