Recap | Apache Pulsar Meetup 上海站_区块链

 

11 月 16 日,StreamNative 联合甜橙金融、涂鸦智能和智联招聘在上海虹口科技金融大厦举办了 Apache Pulsar 线下技术交流会。

众多 Pulsar 社区的技术爱好者们齐聚一堂,参与了此次分享,并与演讲嘉宾进行了热烈的讨论和互动,收获满满。

Recap | Apache Pulsar Meetup 上海站_java_02

本次分享的主要内容为:

  • 张璐波:甜橙金融使用 Apache Pulsar 实现批流融合的实践

  • Pulsar 2.5.0 功能介绍
    - 李鹏辉:Apache Pulsar 2.5.0 功能预览
    - 丛搏:Pulsar schema
    - 翟佳:Kafka on Pulsar (KoP)

  • 张永红:Apache Pulsar 在涂鸦智能的实践

  • 高冉:Pulsar SQL 在智联招聘搜索日志分析的应用

  • 俄广宁/冉小龙:使用 Pulsarctl 和 Pulsar Manager 管理 Pulsar 集群

在 Pulsar 介绍短片后,甜橙金融的谢巍盛院长做了欢迎致辞,简单介绍了甜橙金融的业务状况,并鼓励大家积极为 Pulsar 社区做贡献。

随后,StreamNative Growth 团队的 Jennifer 介绍了 Apache Pulsar 社区的组成、国内外的用户、社区的开发和运营等情况,从为什么加入 Pulsar 社区、如何加入,加入之后能做什么贡献等方面做了详细介绍,让大家从另一个角度更加了解 Pulsar,为本次大会拉开了序幕。


>>> 甜橙金融使用 Apache Pulsar 实现批流融合的实践

Recap | Apache Pulsar Meetup 上海站_编程语言_03

作为国内第二大个人移动支付 APP,翼支付拥有巨大的用户体量,每天会产生万亿条数据,如交易数据、行为数据以及系统日志数据等。如何快速有效地对海量数据进行实时同步和分析变得越来越重要。

甜橙金融的张璐波通过数据统计给大家展示了现代移动支付现状,并从公司之前面临的金融数据挑战角度,进一步强调了金融类行业对消息处理的需求:应对高并发、低延迟、大批量的流处理等。

接下来张璐波从 Apache Pulsar 的分层存储等特点切入,用实例展示了 Apache Pulsar 的基本特性和突出优势(如集群复杂度低、存储空间占用少等),并从甜橙业务的角度讲述了批流融合特性的实践和整个业务功能的架构演进,全面地为大家展现了 Apache Pulsar 在金融类行业的应用。

 

视频


>>> Apache Pulsar 2.5.0 功能介绍

 

Recap | Apache Pulsar Meetup 上海站_人工智能_04

Apache Pulsar 2.5.0 即将发布,在新版本中又添加了很多重要的特性。

智联招聘的消息系统负责人李鹏辉分析了 Pulsar 2.5.0 的以下四个基础功能:Transaction streaming、Sticky consumer、Batch receiving 与 Namespace change events。

从计算层和分析层进行了不同程度的描述,并为现场听众答疑解惑。同时丛搏也从 Pulsar schema 层面,对 2.5.0 版本的改动与更新进行了全面的讲解。

随后,StreamNative 的翟佳为大家介绍了即将开源的 KoP(Kafka on Pulsar)架构与实施情况。KoP 在 Pulsar 上原生支持 Kafka 协议,即用户可以使用 Pulsar 作为底层基础设施,而无需修改基于 Kafka 的各种应用和服务。可以说是为「使用 Kafka 而头疼 topic 数量」的用户带来了希望。


>>> Apache Pulsar 在涂鸦智能的实践

Recap | Apache Pulsar Meetup 上海站_java_05

伴随着 5G 的到来,物联网 IoT 行业迎来了一系列挑战和机遇。涂鸦智能作为一个全球化智能平台,除了在链接各个销售平台厂商外,也与用户之间有着千丝万缕的联系功能。

在主打「万物智能」主题的背后,涂鸦也在寻找极高的性能与稳定性的消息系统。涂鸦智能的张永红为大家展示了之前涂鸦智能的消息系统架构:HTTP 投递方式不灵活、使用 Kafka 情况下 topic 的数量与日俱增、各租户之间相互影响。

而 Apache Pulsar 的运维难度小、多租户隔离等特性正好能解决这些痛点问题,促使涂鸦智能调整了架构。

当然,新消息系统架构在使用过程中也不是完美的,毕竟每个公司的业务需求不尽相同。张永红也列举了他们在使用新架构过程中遇到的 bug,比如消息堆积等状况,并分享了应对方案。

最后通过对不同的消息队列进行对比,进一步说明了 Apache Pulsar 在物联网行业的应用前景十分可观。

 

视频


>>> Pulsar SQL 在智联招聘搜索日志分析的应用

Recap | Apache Pulsar Meetup 上海站_大数据_06

搜索在智联招聘扮演着重要的角色,而搜索日志的采集分析对提升搜索效率、排查问题有着非常重要的作用。

 

智联搜索团队的研发工程师高冉,为我们展示了智联在 C 端用户和 B 端的一些使用场景,并介绍了 Pulsar SQL 的功能。技术栈简单以及与智联无缝衔接的消息系统等特性,成为智联选择 Pulsar SQL 的关键原因。

 

另外,高冉还从 Pulsar SQL 的发送消息和查询数据层面进行了细致的讲解。使用 Pulsar SQL  提升了数据查询的效率,满足了一些数据排查和聚合等场景,但在某些应用场景也略显不足,例如,缺少索引策略。

 

最后,高冉对 Pulsar 提出了一些功能期望,例如,使用 Pulsar SQL 进行消息查询和增加更多使用场景等。这些功能将在日后逐步完善。

 

视频


>>> 使用 Pulsarctl 和 Pulsar Manager 管理 Pulsar 集群

Recap | Apache Pulsar Meetup 上海站_java_07

最后,StreamNative 的两名工程师冉小龙和俄广宁详细介绍了自研开发的 Pulsarctl 和 Pulsar Manager ,包括开发缘由和构建实现,并进行了现场演示。

 

为了弥补 Pulsar Admin 在使用中的一些不足,如依赖多、描述信息不全等,冉小龙和其团队基于 Golang 开发了该集群管理工具,相比 Pulsar Admin 有着更好的执行效率。

Pulsar Manager 也是由 StreamNative 研发并开源的可视化 Pulsar 集群管理工具。相比于 Dashboard 的弱管理特点,使用 Pulsar Manager 可以更方便的管理 clusters、tenants、namespaces、topics、authentication 与 authorization。

以上两个工具都能帮助大家在使用 Pulsar 的过程中,更方便地管理集群。


>>> 总结

Apache Pulsar Meetup 上海站顺利结束,到场的小伙伴们认真聆听分享,Q&A 环节异常活跃。大家对 Pulsar 充满了好奇和期待,好奇它云原生的企业级特性,期待接下来新功能的发布。

Recap | Apache Pulsar Meetup 上海站_编程语言_08

希望大家通过此次线下技术分享会,能进一步加深对 Pulsar 的了解,使用 Pulsar,并积极参与 Pulsar 社区的开发。