8月17日,HBaseCon亚洲2018峰会在北京歌华开元大酒店盛大开幕。作为Apache基金会旗下HBase社区的顶级用户峰会,HBaseCon大会是Apache HBase™官方从2012年开始发起和延续至今的技术会议,先后在美国加州、日本东京和中国深圳等地举办,得到了Google、Facebook、雅虎和阿里巴巴等众多全球顶级互联网公司大力支持。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java


作为国内的主要社区贡献者,阿里巴巴此次联合小米、华为、滴滴等国内主流互联网企业承办的HBaseCon亚洲2018峰会落户北京,本次HBaseCon亚洲峰会不仅得到了Apache官方授权,还得到了来自Cloudera,Intel等商业公司社区PMC的强烈支持。在本次峰会上,三十余位来自亚洲一线互联网和大数据生态相关企业的技术专家和社区领袖集体亮相,为广大开发者带来了HBase及大数据技术生态的最新洞察和行业实践。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_02


在本次HBaseCon亚洲峰会的主论坛上,HBase资深PMC、Cloudera HBase负责人Michael Stack,以及HBase PMC、阿里巴巴高级技术专家Yu Li(李钰)站在开源社区的角度为大家分享了HBase的前世今生;同时,阿里巴巴资深技术专家Chunhui Shen(沈春辉)以及阿里云HBase技术负责人Long Cao(曹龙)则为大家分享了HBase在阿里巴巴集团以及阿里云中的最新发展动态。


此外,在本次HBaseCon亚洲峰会上,三十余位HBase高级技术专家还围绕HBase Internal、Ecology and Solution以及Application三个话题进行了深入的探讨和交流分享。本次HBaseCon亚洲峰会不仅为广大开发者提供了一个了解HBase社区的最新动态和发展计划的窗口,还分享了国内外一线大厂围绕HBase生态的生产实践经验,更为广大HBase开发者以及使用者带来了一场优质的技术盛宴。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_03


本文就来看看HBaseCon亚洲2018峰会上来自阿里巴巴HBase技术专家的精彩分享。

1.Use CCSMap to improve HBase YGC time (Chance Li, Xiang Wang and Lijin Bin)

在本次分享中,三位阿里巴巴技术专家为我们分享了使用CCSMap的原因,CCSMap的具体数据结构,阿里巴巴又是如何通过使用CCSMap来提升HBase YGC时间,以及对于未来进一步相关工作的展望。除此之外,在演讲中还分享了2018年以来,阿里巴巴在搜索方面对于提升服务等级协议(SLA)所作出的努力。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_04


CCSMap是采用了紧凑的数据格式实现的排序Map,其支持无锁的并发写入和查询,能够降低系统的内存消耗,并大幅度降低GC的停顿时间,提升系统的吞吐。与JDK自带的ConcurrentSkipListMap相比而言,CCSMap在50Byte长度KV的测试中,读写吞吐提升了 20~30%,内存占用减少了40%。


2.Separating hot-cold data into heterogeneous storage based on layered compaction (Wenlong Yang)

在本次分享中,HBase Committer,阿里巴巴技术专家,HBase内核负责人WenLong Yang(杨文龙)为大家介绍了HBase上的一种基于分层Compaction和异构存储的冷热分离方案。这种冷热自动分离的特性,能够在系统内部对数据按时间进行物理分层和异构存储(如冷数据使用低成本介质和高压缩率算法,热数据使用高速介质和低压缩率算法),并且对用户访问保持透明。在分享中,杨文龙结合阿里巴巴集团的典型业务场景,从冷热数据的识别、分层压实以及查询优化三个方面深入浅出地为大家讲解了HBase上的内建的冷热多层异构存储特性。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_05


以往的冷热分离方案通常需要构建多个表或者集群来分散地存放冷热数据,而在阿里巴巴内部的HBase分支AliHB中,实现了一套全新的冷热分离方案。这套方案在一张表里通过compaction将冷热数据自动分开,并且能根据冷热数据的特点使用异构介质来平衡存储的性能和成本。同时,针对业务的查询,该方案能够自动地帮助用户进行存储优化,整个过程完全对业务完全透明。在阿里巴巴对于内部业务的测试中发现,这套新的冷热分离存储方案能够降低50%的RT以及25%的存储空间。


3.Kerberos—based Big Data Security Solution and Practice in Alibaba Cloud HBase (Jiajia Li and Chao Guo)

在本次分享中,Apache Kerby/Directory PMC,Intel大数据研发工程师Jiajia Li(李佳佳)与阿里云高级开发工程师Chao Guo(郭超)为大家分享了基于Kerberos的大数据安全解决方案以及其在阿里云HBase上的应用实践。本次分享从Hadoop的鉴权服务谈起,为大家介绍了Hadoop的鉴权服务的背景以及HAS(Hadoop Authentication Service)的相关知识,之后结合具体的实践介绍了阿里云HBase的大数据安全解决方案,以及阿里云在该方案的基础之上所做的相关优化工作。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_06


本次分享中介绍的基于Kerberos的大数据安全解决方案是一种全新的认证解决方案HAS,阿里巴巴已经将该方案应用于阿里云数据库HBase(ApsaraDB for HBase)上的安全和工程应用实践中。HAS支持插件的方式将企业现有的身份认证系统接入Kerberos,使得安全管理人员不需要在已有用户账号系统和Kerberos数据库之间迁移和同步。因此,开源大数据生态系统的大部分组件可以以很小的成本接入HAS。阿里云ApsaraDB for HBase对HAS实现了高可用、高性能、强安全、定制化plugin认证方式等安全和生产环境的稳定性功能。


4.HTAP DB—System : ApsaraDB HBase Phoenix and Spark (Yun Zhang and Wei Li)

在本次分享中,阿里云高级开发工程师Yun Zhang(张赟)和阿里云技术专家Wei Li(李伟)首先从架构设计、用例场景、最佳实践以及挑战与提升这四个方面为大家介绍了基于阿里云ApsaraDB HBase的Phoenix,之后又为大家介绍了如何将ApsaraDB HBase/Phoenix与Spark结合起来发挥更大的价值,不仅为大家分析了选用Spark的原因,还详细地介绍了融合使用ApsaraDB HBase和Spark的架构设计与具体实现,最后还针对于此方案适用的大数据在线报表服务、日志索引以及查询等4种典型应用场景进行了介绍。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_07


Phoenix查询引擎支持使用SQL进行HBase数据的查询,会将SQL查询转换为一个或多个HBase API,协同处理器与自定义过滤器的实现,并编排执行。使用Phoenix进行简单查询,性能量级能够达到毫秒级别。


5.A real—time cold backup solution for HBase with zero HBase modification,low latency and heterogeneous storage (QingYi Meng)

在本次分享中,阿里巴巴技术专家QingYi Meng(孟庆义)为大家介绍了能够实现一种零侵入,低延时,异构存储的HBase实时冷备解决方案。在分享中,QingYi Meng首先从HBase的备份发展现状谈起,之后介绍了阿里巴巴对于HBase数据备份的具体需求,在需求之后,重点介绍了阿里巴巴的零侵入的存量备份方案,以及在低延时,快速集群重建方面的设计和实践,在分享的最后还对于数据备份的未来进行了展望。


【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_08


数据可靠性是业务的生命线,同时也是分布式存储系统的核心价值之一。常见的主备容灾,异地多活可以做到机房级、城市级的容灾保障,但通常的解决方案使用的是同构系统,并且由单一团队运维,由于软件缺陷或者运维人员失误而造成的数据丢失案例是真实存在的。另一方面,可能发生的数据污染要求系统具备回溯到任意历史时间点的能力。而独立于HBase部署的零侵入,低延时,异构存储的HBase实时冷备方案,能够在不影响线上业务的情况下通过周期存量备份+实时增量备份的方式将数据存储在异构系统中。


除了上述提到的亮点技术分享,第二届HBaseCon峰会还有众多精彩的Sessions,给大家带来一场思维碰撞的盛宴。Apache HBase PMC主席Michael Stack也参加了此次会议,和各位开发者们共同探讨HBase的现状和未来。


这次HBaseCon的参会者比去年更多,从今年和去年的对比来看,HBase在国内企业中的使用也更加广泛、更加成熟。HBaseCon Asia作为HBase开发者之间一年一度交流的盛会,让HBase使用者、开发者能够看到HBase发展动态。除了HBase本身,还有围绕着HBase的生态也越来越丰富,共同打造更加易用、更高性能、更稳定的大数据存储系统。从华为到阿里的接力棒,相信HBaseCon Asia会越来越好,也预示着国内开发者和使用者的影响力越来越大,进一步为大数据和AI的智能时代添砖加瓦!


作为Apache基金会旗下HBase社区的顶级用户峰会,HBaseCon大会是Apache HBase™官方从2012年开始发起和延续至今的技术会议,先后在美国加州、日本东京和中国深圳等地举办,得到了Google、Facebook、雅虎和阿里巴巴等众多全球顶级互联网公司大力支持此次大会期间,云栖社区为独家直播合作方,以下是本次大会的PPT下载地址


Keynote-1

标题:HBase Current State and Future : Community View

演讲者:Michael Stack,Duo Zhang and Yu Li

PPT下载地址:https://yq.aliyun.com/download/2916

 

Keynote-2

标题:Recent Development of HBase in Alibaba and Cloud

演讲者:Chunhui Shen and Long Cao

PPT下载地址:https://yq.aliyun.com/download/2917

 

Track1-1

标题:Use CCSMap to improve HBase YGC time

演讲者:   Chance Li and Lijin Bin  

PPT下载地址:https://yq.aliyun.com/download/2918

 

Track1-2

标题:WALLess HBase with persistent memory devices

演讲者:Ramkrishna Vasudevan and Anoop Sam John

PPT下载地址:https://yq.aliyun.com/download/2919

视频地址:敬请期待

 

Track1-3

标题:HBase at Xiaomi

演讲者:GuangHao Zhang

PPT下载地址:https://yq.aliyun.com/download/2920

 

Track1-4

标题:HBase at DiDi

演讲者:JingYi Yao

PPT下载地址:https://yq.aliyun.com/download/2921

 

Track1-5

标题:Improving HBase reliability at Pinterest with geo-­‐replication and efficient backup

演讲者:Chenji Pan and Lianghong Xu

PPT下载地址:https://yq.aliyun.com/download/2922

 

Track1-6

标题:Separating hot-cold data into heterogeneous storage based on layered compaction

演讲者:WenLong Yang

PPT下载地址:https://yq.aliyun.com/download/2923

 

Track1-7

标题:HDFS optimization for HBase at XiaoMi

演讲者:Gang Xie, Yingchao Zhou and Chen Zhang

PPT下载地址:https://yq.aliyun.com/download/2924

 

Track2-1

标题:Kerberos—based Big Data Security Solution and Practice in Alibaba Cloud HBase

演讲者:Jiajia Li and Chao Guo

PPT下载地址:https://yq.aliyun.com/download/2925

 

Track2-2

标题:Apache Kylin on HBase: extreme OLAP for big data

演讲者:ShaoFeng Shi

PPT下载地址:https://yq.aliyun.com/download/2926

 

Track2-3

标题:Bringing MySQL Compatibility to HBase using Database Virtualization

演讲者:Water Guo

PPT下载地址:https://yq.aliyun.com/download/2927

 

Track2-4

标题:HTAP DB—System : ApsaraDB HBase Phoenix and Spark

演讲者:Yun Zhang and Wei Li

PPT下载地址:https://yq.aliyun.com/download/2928

 

Track2-5

标题:JanusGraph—Distributed graph database with HBase

演讲者:XueMin Zhang

PPT下载地址:https://yq.aliyun.com/download/2929

 

Track2-6

标题:Scaling 30 TB's of Data lake with Apache HBase and Scala DSL at Production

演讲者:Chetankumar Jyestaram Khatri

PPT下载地址:https://yq.aliyun.com/download/2930

 

Track2-7

标题:A real—time cold backup solution for HBase with zero HBase modification,low latency and heterogeneous storage

演讲者:QingYi Meng

PPT下载地址:https://yq.aliyun.com/download/2931

 

Track3-1

标题:Serving billions of queries in millisecond latency

演讲者:Biju Nair

PPT下载地址:https://yq.aliyun.com/download/2932

 

Track3-2

标题:HBase at China Telecom

演讲者:Chen Ze

PPT下载地址:https://yq.aliyun.com/download/2933

 

Track3-3

标题:HBase Practice In China Life Insurance

演讲者:Zheng Fan

PPT下载地址:https://yq.aliyun.com/download/2934

 

Track3-4

标题:HBase and OpenTSDB practice at Huawei

演讲者:Pankaj Kumar, Wei Zhi and Chaoqiang Zhong

PPT下载地址:https://yq.aliyun.com/download/2935

 

Track3-5

标题:HBase Practice at Lianjia

演讲者:GuoXian Zhao

PPT下载地址:https://yq.aliyun.com/download/2936

 

Track3-6

标题:HBase at Meituan

演讲者:Chen Xu

PPT下载地址:https://yq.aliyun.com/download/2937

 

Track3-7

标题:The Application of Hbase in New Energy Vehicle Monitoring System

演讲者:Yan Yu

PPT下载地址:https://yq.aliyun.com/download/2938


更多精彩欢迎观看大会视频:

https://yq.aliyun.com/promotion/631


大家工作学习遇到HBase技术问题,把问题发布到HBase技术社区论坛http://hbase.group,欢迎大家论坛上面提问留言讨论。想了解更多HBase技术关注HBase技术社区公众号(微信号:hbasegroup),非常欢迎大家积极投稿。

【峰会PPT下载】HBaseCon亚洲2018峰会盛大开幕_Java_09