Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现..随着内容管理应用程序的日益普及,对用于内容仓库的普通、标准化 API 的需求已凸现出来。Content Repository for Java Technology API (JS...
转载 2016-01-05 17:23:00
277阅读
2评论
本文接着分析jackrabbit与lucene交互的核心类SearchIndex,lucene的索引与检索都是通过该类实现的SearchIndex类继承自抽象类AbstractQueryHandler,而抽象类AbstractQueryHandler实现了QueryHandler接口先浏览一下Que...
转载 2013-04-07 02:21:00
49阅读
本文家下来分析SearchManager类的源码,该类实现了SynchronousEventListener接口,而SynchronousEventListener接口继承自EventListener接口,EventListener接口只有一个事件监听方法SearchManager类的源码如下:/*...
转载 2013-04-07 02:51:00
111阅读
2评论
上文最后提到jackrabbit的检索默认实现类QueryImpl,先熟悉一下该类的继承层次QueryImpl继承自抽象类AbstractQueryImpl,而抽象类实现了Query接口(JCR的接口)Query接口源码如下: /** * A <code>Query</code> object. */public interface Query { /** *
转载 2013-04-07 03:29:00
113阅读
2评论
上文分析了jackrabbit对富文档的文本抽取实现的源码,我们注意到,上文的文本抽取类LazyTextExtractorField继承自lucene的AbstractField类,即LazyTextExtractorField类是Field类型的,这正是构建lucene索引Document里面的F...
转载 2013-04-07 01:13:00
43阅读
项目地址:://pan.baidu.com/s/1mipSR7UJackrabbit是Apache基
转载 2022-03-04 17:09:55
1546阅读
同步一个遇到的问题,前几天,客户给了一个server地址和usernamepassword。让把上面的文件,download到还有一台server上。我查了下,发现该server使用文件协议是webdav,什么鬼。。。曾经用的文件协议都是sftp或者ftp… 这个webdav还真是从来没听说过,又暴
转载 2017-07-01 11:00:00
35阅读
2评论
对于springboot操作hbase来说,我们可以选择官方的依赖包hbase-client,但这个包的google类库很多时候会和你的项目里的google类库冲突,最后就是你的程序缺少类而无法启动,解决这个问题的方法很多,而最彻底的就是自己封装一个shade包,或者使用人家封装好的shade包,shade就是maven里的一个重写包的插件,非常好用。依赖包之前的原始包 <dependenc
转载 2021-02-26 15:44:03
1161阅读
2评论
Hbase简介HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、 实时读写的分布式数据库 利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理 HBase中的海量数据,利用Zookeeper作为其分布式协同服务 主要用来存储非结构化和半结构化的松散数据(列存NoSQL数据库)HBase数据模型命名空间 命名空间是对表的逻辑分
转载 2023-08-18 21:50:25
203阅读
HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,特点:海量存储列式存储极易扩展高并发稀疏
转载 2023-05-18 13:32:53
171阅读
本次的业务是基于短信发送之前,去做黑名单的校验和发送内容的检测,因此,在进行下一步业务之前,我需要等待黑名单的查询结果,由于线上环境的Hbase出故障,导致整个业务堵塞,因此,想到了对hbase异常做上容错机制,因此,有了以下的内容 try { counts = hbaseService.get("cmcc_sms_blacklist",serviceId,"counts","count"
logback详解,Flink流处理案例及Hive和Hbase的整合1. [logback的使用和logback.xml详解]()1.1. 按指定间隔滚动生成日志文件1.2. [logback指定某一包或者类下日志记录到不同文件中]()1.3. [logback按日期和大小切分日志]()2. Flink前期数据准备2.1. 获取数据(拉钩网爬虫)[[github链接]](https://gith
转载 2024-05-27 19:19:44
73阅读
hbase编程指南@(HBASE)[hbase, 大数据] hbase编程指南一概述一创建项目1pomxml2在eclipse中运行的注意事项3关于addResource的说明二Best Practices三常用API一创建Configuration及Connection对象二表管理1创建表2判断表是否存在3删除表三插入数据1插入单条数据2使用缓存四读取数据单个数据和一批数据1遍历返回数据的方法五
转载 2023-09-01 11:09:56
167阅读
 1.不同版本间集群是否可以迁移?2.distcp命令的作用是什么?3..MEAT表的作用是什么?4.相互不通信集群,数据该如何迁移?HBase迁移数据方案一(集群互联)花了一天的时间查资料做测试,略微的总结了一下hbase数据迁移的方法。一、需要在hbase集群停掉的情况下迁移步骤:(1)执行Hadoop distcp -f filelist "hdfs://new cluster i
转载 2024-02-05 14:12:12
89阅读
HBase是什么?HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分
原创 2023-01-02 21:43:53
224阅读
对于分布式数据库来说,容错处理是非常重要的一个部分。RegionServer是HBase系统中存在最多的节点,所以对于RegionServer的容错处理对于HBase来说至关重要。本文对RegionServer的容错处理进行Step by Step的分析,希望能解释清除整个过程并加以点评。 我们假设在HBase运行的过程中有一个RegionServer突然Crash, 基于这个场景进行分析。 1
转载 2023-11-18 23:54:22
228阅读
1. HBASE架构 我们知道HBase依赖HDFS也依赖Zookeeper,那么首先出来的应该是HDFS,这是他底层的存储地,随便画几个DataNode无所谓,然后HBase还依赖Zookeeper,因此我们在启动HBase之前需要先启动它们。那接下轮到HBase启动了,HBase需要启动两大进程HMaster和HRegionServer,这个Master工作太累了,它需要把某些工作交给Zook
转载 2023-09-04 19:36:39
76阅读
1. 工作原理读请求到HBase之后先尝试查询BlockCache,如果获取不到就去HFile(StoreFile)和Memstore中去获取。如果获取到了则在返回数据的同时把Block块缓存到BlockCache中。它默认是开启的,一个RegionServer只有一个BlockCache。BlockCache默认开启,如果关闭BlockCache:alter 'testTable', CONFI
转载 2023-12-15 14:08:11
86阅读
HBase提供了两种不同的BlockCache实现来缓存从HDFS读取的数据:默认的堆上LruBlockCache和BucketCache(通常是堆外)。 本节讨论每种实现的优缺点,如何选择适当的选项以及每种实现的配置选项。LruBlockCache是原始实现,并且完全在Java堆中。 虽然BucketCache也可以是文件支持的缓存,但BucketCache是可选的,并且主要用于保持块缓存数据不
转载 2023-09-23 13:31:56
60阅读
HBase 是一种分布式、可扩展、支持海量数据存储的 NoSQL 数据库。HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,用于存储海量的结构化或者半结构化,非结构化的数据。HBase 架构1. Region ServerRegion Server 为 Region 的管理者,负责数据的读写服务,用户通过与Region server交互来实现对数据的访问。 对于数据的操作:get
转载 2023-08-18 21:38:02
270阅读
  • 1
  • 2
  • 3
  • 4
  • 5