大数据处理里面比较重要的一项功能就是快速查询检索。这里我们说的检索一般是指全文检索,全文检索功能是关系数据库的弱项。我们知道,关系数据库一般使用LIKE进行模糊查询检索。使用关系数据库的SQL语法里的LIKE 模糊匹配查询时,如果把百分号在前面,就用不到索引了,需要全表扫描,对于海量数据而言,这种查法就是噩梦,几乎不可能实现检索任务。并且全文检索涉及到分词和相关性计算,这些都不能通过关系数据库实现,因此需要引入另外的架构体系。 ElasticSearch(以下简称ES)就是用来做这个的,它的底层实现是Lucene,历史比较悠久。算法已经比较成熟了。 这里我们先不去探究底层的算法知识,比如倒排索引啥的,也不涉及集群搭建等知识,这些是系统管理员需要了解的内容。大多数人并不需要了解这些底层或深入的东西,只需要知道怎样快速上手使用,快速形成生产力。看了网上有很多文章,要么拖沓冗长,要么一鳞半爪的不连贯,要么太偏重理论枯燥乏味,看着看着就疲倦了。有的举例涉及的版本有点老,最新版本用不上,比较误导。本文针对最新的版本8.x介绍怎样快速入门。
消息中间件是构建对性能有较高要求的应用时采用的主要技术之一,本文用简洁的文字描述了怎样快速入手消息中间件之一——kafka
postgresql是目前比较有影响的开源数据库之一,相比MySQL有一些自己的功能特色,比如设计规整、文档齐全,内置支持空间信息管理等,但由于设计时考虑欠周,过分追求学院派风格,一些常用的功能用起来不是很方便,比较繁琐。比如存储过程不能返回数据集,函数支持返回数据集但使用比较繁琐,函数支持重载增加了设计和使用的复杂度。因此大的管理系统并不太适合选择postgresql用于生产环境。 否则后续开发维护扩展都会比较困难。
数据导入是后台应用的一个常规问题,如何让平台框架具备高效而通用的导出和导入功能是设计人员孜孜以求的目标。本文用示例代码详细展示了通用导入功能的设计方法和要点。
一个极简Web框架,不需要维护中台,前端调用并穿透中台,直接使用后端SP,因为可以节省中台维护工作量,适用于大多数中小型项目。
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号