kafka-2.6.0源码阅读1 调试类代码修改2 生产者源码2.1 runOnce方法2.2 sendProducerData方法2.3 poll方法3 broker工作流程解析3.1 broker和kafka server的概念说明3.2 KafkaServer启动的线程3.3 broker接收请求及处理流程3.4 调试4 消费者5 总结   在其源码阅读说明中已经大致给出了相关的梳理,这里
转载 7月前
16阅读
这篇博客将会记录Structured Streaming + Kafka的一些基本使用(Java 版)spark 2.3.01. 概述Structured Streaming (结构化流)是一种基于 Spark SQL 引擎构建的可扩展且容错的 stream processing engine (流处理引擎)。可以使用Dataset/DataFrame API 来表示 streaming aggr
文章目录前言顺序问题1. 为什么要保证消息的顺序?2.如何保证消息顺序?3.出现意外4.解决过程消息积压1. 消息体过大2. 路由规则不合理3. 批量操作引起的连锁反应4. 表过大主键冲突数据库主从延迟重复消费多环境消费问题后记 前言假如有家公司是做餐饮系统的,每天中午和晚上用餐高峰期,系统的并发量不容小觑。为了保险起见,公司规定各部门都要在吃饭的时间轮流值班,保证出现线上问题时能够及时处理。有
目录1.前言2.实践代码(以下操作都在WIN7系统)    2.1环境背景    2.2环境搭建        2.2.1启动zookeeper(因为kafka依赖zookeeper)        2.2.2启动kafka  &
转载 2024-10-28 10:21:54
380阅读
 全局参数[server.properties]需要修改的参数Broker 端参数ZooKeeper 设置Broker通信Topic参数数据存储参数Topic 级别参数数据保存参数Topic 级别参数的设置创建 Topic 时进行设置修改 Topic 时设置JVM 参数堆内存设置GC的设置如何设置操作系统参数文件描述符限制文件系统类型Swappiness提交时间/Flush 落盘时间&n
转载 2024-03-21 08:52:18
86阅读
ELK+kafka构建日志收集系统 背景:最近线上上了ELK,但是只用了一台Redis在中间作为消息队列,以减轻前端es集群的压力,Redis的集群解决方案暂时没有接触过,并且Redis作为消息队列并不是它的强项;所以最近将Redis换成了专业的消息信息发布订阅系统Kafka, Kafka的更多介绍大家可以看这里: 传送门 ,关于ELK的知识网上有很多的哦,&nbs
一、flume配置 flume要求1.6以上版本 flume-conf.properties文件配置内容,sinks的输出作为kafka的product [html]  view plain  copy 1. a1.sources = r1 2. a1.sinks = k1 3. a1.channels = c1 4
每个消费者都会通过HeartbeatTask任务定时向GroupCoordinator发送heartbeatRequest,告知GroupCoordinator自己正常在线。 HeartBeatRequest首先由KafkaApi.handleHeartbeatRequest方法进行处理,它负责验证权限,定义回调函数,并将请求委托给GroupCoordinator处理。def handleHear
转载 2024-10-18 06:40:47
27阅读
1. 实验环境CPU:4 内存:8G ip:192.168.0.187开启iptables防火墙 关闭selinux java >=1.5 使用yum方式安装的java,提前配置好JAVA_HOME环境变量vim /etc/profile.d/java.sh #!/bin/bash export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openj
转载 2024-04-24 15:28:02
120阅读
ip:47.96.40.83 web-port:8030 jdbc-port:9030 username:admin/root password:空 — fe启停 /opt/apache-doris-2.1.9/fe/bin/start-fe.sh —daemon /opt/apache-doris-2.1.9/fe/bin/stop-fe.sh — be启停 /opt/apache-dor
原创 6月前
17阅读
大家好,我是一哥,Doris成为MPP数据库新贵。Doris起源于百度,致力于满足企业用户的多种数据分析场景
转载 2022-06-06 17:05:16
1104阅读
数据集成平台(Tis)集成了Flink-CDC、DataX等大数据组件,提供一站式数据集成服务。支持多种数据源,涵盖MySQL、Oracle、ElasticSearch等,兼容国产数据库,满足多源异构数据集成需求。
1个Taksmanager可以跑多个任务 cat /root/flink114/lib64/python3.8/site-packages/pyflink/conf/flink-conf.yaml | grep numtaskmanager.numberOfTaskSlots: 2(本来是1)修改了以后,需要重启flink集群写入doris出现了这个错误:[_test_slow_logs
原创 6月前
0阅读
Doris集群机器规划以下是Doris集群的服务器规划配置信息,目前采用3节点混部模式。FE3个实例,BE3个实例,构成最低配集群。服务器名服务器IP角色Doris-node0110.19.162.103FE、BEDoris-node0210.19.162.104FE、BEDoris-node0310.19.162.106FE、BEDoris简介官网:首页 - Apache Doris核心组件简介
参考资料 [1] MySQL体系架构简介 [2] MySQL 整体架构一览 目录1. 路径2. 文件3. 配置4. 逻辑系统架构4.1 应用层4.2 MySQL 服务层4.3 存储引擎层5. SQL SELECT语句执行过程第1步:Connectors :客户端/服务端通信协议第2步:查询缓存第3步:Analyzer分析器第4步:Optimizer优化器:查询优化第5步:查询执行引擎Actuato
转载 2023-07-30 14:41:13
549阅读
 Doris 高可用集群的部署 一、主机规划IP主机名安装包10.207.228.64doris-1FE、BE、Broker10.207.228.194doris-2FE、BE、Broker10.207.228.197doris-3FE、BE、Broker二、JDK 部署(1) 下载安装包jdk-8u301-linux-x64.tar.gz(2) 解压tar -xf jdk-8
转载 2023-10-26 05:32:38
257阅读
# 使用 Java 调用 Doris 接口的介绍 Doris 是一款现代化的分布式系统,专为快速的分析和实时的业务需求而设计。它可以支持大规模的数据处理,尤其在进行 OLAP(联机分析处理)时表现出色。本文将为你介绍如何使用 Java 调用 Doris API,并提供示例代码。 ## 1. Doris 简介 Doris 是由百度开源的一款高性能、简单易用的分布式分析数据库,主要用于在线分析和
原创 9月前
767阅读
一、doris是什么Apache Doris是一个现代化的MPP(大规模并行分析)分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非常简洁,易于运维,并且可以支持10PB以上的超大数据集。Apache Doris可以满足多种数据分析需求,例如固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等。令数据分析工作更加简单高效!二
转载 2024-05-14 21:34:58
283阅读
6月29日,Doris有幸得到中国信通院云大所、大数据技术标准推进委员会的支持,在中国信通院举行了0.11.0新版本预览线下沙龙。各位嘉宾都带来了干货满满的分享。关注Doris官方公众号,后台回复“0629”即可获取各位嘉宾分享PPT及现场录像。 今天是朱良昌同学代表百度智能云流式计算团队带来Spark Streaming对接Doris 设计与实现的分享。 业务场景 
doris的三种数据模型:一、Doris三种数据模型Doris 的数据模型主要分为3类: - Aggregate - Uniq - DuplicateAggregate 模型 聚合模型:聚合模型需要用户在建表时显式的将列分为 Key 列和 Value 列。该模型会自动的对 Key 相同的行,在 Value 列上进行聚合操作。当我们导入数据时,对于 Key 列相同的行会聚合成一行,而 Value 列
转载 2024-06-25 12:51:54
116阅读
  • 1
  • 2
  • 3
  • 4
  • 5