大数据处理点滴笔记一般来说,根据数量级,两千万以内用MySQL, 两千万以上用Mongodb ,亿级别的用Hadoop。几十亿的数据hbase.用来做统计,Mongodb还是有一定的优势-----------------------------------------------------------------------------------------------------
原创 2023-04-25 21:21:21
70阅读
ss
原创 2023-07-05 16:36:57
19阅读
原创 2024-03-12 16:19:43
0阅读
          
原创 2024-08-22 14:27:46
58阅读
1. 背景随着大数据时代来临,人们发现数据越来越多。但是如何对大数据进行存储与分析呢? 单机PC存储和分析数据存在很多瓶颈,包括存储容量、读写速率、计算效率等等,这些单机PC无法满足要求。2. 为解决这些存储容量、读写速率、计算效率等等问题,google大数据技术开发了三大革命性技术解决这些问题,这...
转载 2015-09-16 15:41:00
383阅读
2评论
一、Hadoop部署,Hadoop之父------》Doug  cutting (1)Cloudera                    25%(2)Hortonworks              15%
原创 2022-11-03 14:26:42
50阅读
#2018-07-19#1.同步集群时间2.数据导入flume使用 flume 收集 nginx 服务器的日志到 hdfs (1)配置代理[root@master1 ~]# vim /etc/flume/conf/flume.conf添加:# #配置Agenta1.sources = r1a1.sinks = k1a1.channels = c1# # 配...
原创 2021-06-04 19:20:01
560阅读
第28章 HIVEQLHIVEQL(HIVEQuery Language:Hive查询语言)是一种查询语言,该语言为Hive处理并分析Metastore的结构数据
第24章分区 Hive组织table进入分区。该方法是把一个表分层相关的部分,每个部分基于分区列的值,如日期、城市、部门等。用分区
第25章内置运算符本章用来解释Hive的内置运算符,Hive有四种运算符:关系运算符、算术运算符、逻辑运算符、复杂运算符
第22章数据库操作22.1 创建数据库         Hive是一个数据库技术,该技术可以定义数据库和表用于分析结构数据。结构化数据分析的主题是以表格方式存储数据
第13章 KAFKA基本组成与集群架构13.1 KAFKA的基本组成       在深入学习KAFKA之前,必须知道的专业术语如:主题(topics)
第10章 zookeeper 命令行接口ZooKeeper命令行接口被用于与zookeeperensemble进行交互。调试、带有不同option的工作是非常有用的
原创 2022-06-15 17:43:59
153阅读
   如何在zookeeper集群中选举出一个leader,zookeeper使用了三种算法,具体使用哪种算法,在配置文件中是可以配置的,对应的配置项是”electionAlg”,其中1对应的是LeaderElection算法
转载 2022-06-15 17:44:24
52阅读
第二部分 KAFKA学习 该部分,主要对Spark学习笔记进行记录,学习资料翻译自《apache_kafka_tutorial》
第3章 Spark安装Spark是Hadoop的子项目。因此,Spark最好安装在Linux系统。安装步骤如下:Step
原创 2022-06-15 17:45:31
99阅读
第2章 Spark弹性分布数据集2.1 弹性分布式数据集     弹性分布式数据集(Resilient Distributed Datasets(RDD))是spark的一种基本的数据结构。
1.修改主机名hostnamectl set-hostname masterbash 2.替换本地源pkill -9 yum //杀掉yum进程cd /etc/yum.repos.dcat bigdata.repo //查看本地源rm -rf * //删除wget http://172.19.47. ...
转载 2021-10-20 18:14:00
264阅读
2评论
原创 2022-12-14 14:28:55
79阅读
第33章 HBASE ADMIN APIHBase是Java编写的,因此Java为HBase提供了一个API用来实现与HBase的交互。Java API是与HBase交互最快的方法。下面给出JavaA
  • 1
  • 2
  • 3
  • 4
  • 5