hadoop入门到实战

hadoop入门到实战（15）Sqoop从入门到实战

第1章 Sqoop 简介 Sqoop 是一款开源的工具，主要用于在 Hadoop(Hive) 与传统的数据库 (mysql,postgresql,...) 间进行数据的高校传递，可以将一个关系型数据库（例如：MySQL,Oracle,Postgres等）中的数据导入到 Hadoop 的 HDFS 中

sqoop

hive

hadoop

mysql

hdfs

转载

mb5fed6ec4336ce

2020-05-30 19:07:00

569阅读

2评论

hadoop入门到实战（17）Oozie从入门到实战

第1章 Oozie 的简介 Oozie 英文翻译为：驯象人。一个基于工作流引擎的开源框架，由 Cloudera 公司贡献给 Apache，提供对 Hadoop MapReduce、Pig Jobs 的任务调度与协调。Oozie 需要部署到 Java Servlet 容器中运行。主要用于定时调度任务，

hadoop

h5

xml

hdfs

mapreduce

转载

mb5fe94d257d327

2020-05-30 20:17:00

650阅读

2评论

hadoop入门到实战（16）azkaban从入门到实战

一概述 1.1 为什么需要工作流调度系统 1）一个完整的数据分析系统通常都是由大量任务单元组成： shell 脚本程序，java 程序，mapreduce 程序、hive 脚本等。2）各任务单元之间存在时间先后及前后依赖关系。3）为了很好地组织起这样的复杂执行计划，需要一个工作流调度系统来调度执行

hadoop

mysql

服务器

hive

sql

转载

mob60475701b76f

2020-05-30 19:09:00

1430阅读

2评论

hadoop入门到实战（10）hive从入门到实战四

第8章压缩和存储（Hive高级） 8.1 Hadoop源码编译支持Snappy压缩 8.1.1 资源准备 1、CentOS联网配置CentOS能连接外网。Linux虚拟机 ping www.baidu.com 是畅通的。注意：采用root角色编译，减少文件夹权限出现问题。2、jar包准备(ha

hive

hadoop

数据

mapreduce

字段

转载

mb5ff980b461ced

2020-05-30 18:44:00

203阅读

2评论

hadoop入门到实战（7）hive从入门到实战一

第1章 Hive入门 1.1 什么是Hive Hive：由Facebook开源用于解决海量结构化日志的数据统计（分析数据的框架）。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成MapReduce程序。 1）Hive

hive

hadoop

mysql

java

数据库

转载

mb5ff980b461ced

2020-05-30 18:37:00

286阅读

2评论

hadoop入门到实战（11）hive从入门到实战五

第10章 Hive实战之谷粒影音 10.1 需求描述统计硅谷影音视频网站的常规指标，各种TopN指标：统计视频观看数Top10 统计视频类别热度Top10 统计出视频观看数最高的20个视频的所属视频类别以及对应视频类别的个数统计视频观看数Top50所关联视频的所属类别Rank 统计每个类别中的

ide

hadoop

apache

数据

字段

转载

mb5ff980b461ced

2020-05-30 18:46:00

267阅读

2评论

hadoop入门到实战（9）hive从入门到实战三

第6章查询 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select查询语句语法： [WITH CommonTableExpression (, CommonTableExpression)*] (Note: On

hive

数据

导入数据

mapreduce

字段

转载

mb5ff980b461ced

2020-05-30 18:42:00

274阅读

2评论

hadoop入门到实战（12）hive从入门到实战六

一、知识梳理 1.1、背景表结构在讲解中我们需要贯串一个例子，所以需要设计一个情景，对应还要有一个表结构和填充数据。如下：有 3 个字段，分别为 personId 标识某一个人，company 标识一家公司名称，money 标识该公司每年盈利收入（单位：万元人民币）建表并导入数据： create

hive

hadoop

数据

字段

分隔符

转载

mb5ff980b461ced

2020-05-30 18:50:00

322阅读

2评论

hadoop入门到实战（8）hive从入门到实战二

第4章 DDL数据定义 4.1 创建数据库 1）创建一个数据库，数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; 2）避免要创建的数据库已经存在错误，增加 if not exist

hive

数据

数据库

分区表

hdfs

转载

mb5ff980b461ced

2020-05-30 18:39:00

216阅读

2评论

hadoop入门到实战（3）hive数据仓库入门到实战及面试

第一章、hive入门一、hive入门手册 1.什么是数据仓库 1.1数据仓库概念对历史数据变化的统计，从而支撑企业的决策。比如：某个商品最近一个月的销量，预判下个月应该销售多少，从而补充多少货源。 1.2传统数据仓库面临的挑战（1）无法满足快速增长的海量数据存储需求（2）无法有效处理不同类型

hive

数据

hadoop

apache

mapreduce

转载

mb5fd86a704dffe

2020-05-13 16:23:00

1578阅读

2评论

1．安装Hadoop 和Spark 进入 Linux 系统，参照本教程官网“实验指南”栏目的“Hadoop 的安装和使用”，完成 Hadoop 伪分布式模式的安装。完成 Hadoop 的安装以后，再安装 Spark（Local 模式）。2．HDFS 常用操作使用 hadoop 用户名登录进入 Linux 系统，启动 Hadoop，参照相关 Hadoop 书籍或网络资料，或者也可以参考本教程官网的“

hadoop入门 python

hadoop

HDFS

Hadoop

转载

mob64ca140fd7c1

2023-08-29 14:04:19

74阅读

hadoop入门 java hadoop入门实战

hadoop经典案例————单词统计目录hadoop经典案例————单词统计1. 打开HDFS的UI界面，查看是否有数据文件，默认是没有数据文件。2. 准备文本文件，在Linux系统上编辑一个文本文件，然后上传到HDFS上。2.1 在/export目录下新建data目录，存放数据文件 2.2 在HDFS上创建目录2.3 将word.txt文件上传到input文件夹下3. 运行hadoop

hadoop入门 java

hadoop

big data

HDFS

jar包

转载

mob64ca140ac564

2024-01-09 22:17:30

50阅读

hadoop入门2018 hadoop入门实战

文章目录前言一、Hadoop组件二、Hadoop集群搭建三、Hadoop运维（一）Hive运维（二）利用sqoop将关系型数据库数据接入HDFS（三）利用sqoop将HDFS文件导出至关系型数据库四、mapreduce五、yarn六、HDFS七、Hadoop常用命令前言记录Hadoop学习与实战过程。持续更新中。一、Hadoop组件组件名称主要功能hdfs分布式文件存储mapreduce批量处

hadoop入门2018

hadoop

hive

Hadoop

hdfs

转载

卫斯理

2023-11-18 23:27:11

70阅读

hadoop实战入门

# Hadoop实战入门：从理论到实践 Hadoop是一个开源的分布式计算框架，它允许在普通硬件上存储和处理大量数据。本文将从Hadoop的基本概念出发，通过代码示例和甘特图，帮助读者快速入门Hadoop实战。 ## Hadoop简介 Hadoop的核心是HDFS（Hadoop Distributed File System）和MapReduce。HDFS是一个分布式文件系统，它将数据存储在

Hadoop

Text

Java

原创

mob64ca12da726f

2024-07-27 06:59:14

46阅读

hadoop入门到实战（1）hive优化总结

1. 概述 1.1 hive的特征：可以通过SQL轻松访问数据的工具，从而实现数据仓库任务，如提取/转换/加载（ETL），报告和数据分析；它可以使已经存储的数据结构化；可以直接访问存储在Apache HDFS或其他数据存储系统（如Apache HBase）中的文件； Hive除了支持MapRe

hive

数据

hadoop

mapreduce

sql

转载

mob604756ee63c0

2020-05-07 11:06:00

98阅读

Hadoop入门实战手册

Hadoop入门文档，比较实用。详细文档在附件中。。。 1 概述 1.1 什么是Hadoop？ 1.2 为什么要选择Hadoop？ 1.2.1 &

职场

休闲

hadoop 手册

原创

高级devops

2012-03-23 14:57:11

1887阅读

Hadoop入门到实战（5）sql语句大全（详细）

数据库操作查看所有数据库 show databases; 1 查看当前使用的数据库 select database(); 1 创建数据库 create databases 数据库名 charset=utf8; 5.删除数据库 drop database 数据库名 1 6 .使用数据句库 use d

表名

数据

字段

子查询

数据库

转载

mb5fdb1266ce6df

2020-05-20 17:56:00

245阅读

2评论

hadoop 实战 pdf hadoop 入门实例

上一节课我们一起学习了RPC简单用法，这节课我们来学习MapReduce，MapReduce可谓是Hadoop当中非常重要的一部分，不学好这部分，我们就无法真正学会Haoop。那么，首先我们来看一个MapReduce最简单的例子，如下图所示，假如我们要

hadoop 实战 pdf

环形缓冲

HDFS

Math

转载

deanyuancn

2024-06-05 15:38:16

15阅读

SparkStreaming入门到实战之(6)--sparkstreaming入门到实战

第1章 Spark Streaming 概述 1.1 什么是 Spark Streaming Spark Streaming 类似于 Apache Storm，用于流式数据的处理。根据其官方文档介绍，Spark Streaming 有高吞吐量和容错能力强等特点。Spark Streaming 支持的

spark

转载

mob604756f5c18e

2020-05-29 18:11:00

366阅读

2评论

hadoop从入门到放弃 hadoop基础入门

hadoop的各类安装和部署文档布满整个网络，安装配置也很容易，感觉对整个过程以及各配置文档理解才是最重要的。本次在操作pezy的一体机时，结合实际使用整理hadoop的一些知识供日后使用（当然多是理解之后直接引入网络上的资料）。一、网络名词copyNameNode： NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。

hadoop从入门到放弃

linux

集群

hadoop

HDFS

转载

烂漫树林

2023-07-25 18:31:58

71阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

hadoop入门到实战

hadoop入门到实战（15）Sqoop从入门到实战

hadoop入门到实战（17）Oozie从入门到实战

hadoop入门到实战（16）azkaban从入门到实战

hadoop入门到实战（10）hive从入门到实战四

hadoop入门到实战（7）hive从入门到实战一

hadoop入门到实战（11）hive从入门到实战五

hadoop入门到实战（9）hive从入门到实战三

hadoop入门到实战（12）hive从入门到实战六

hadoop入门到实战（8）hive从入门到实战二

hadoop入门到实战（3）hive数据仓库入门到实战及面试

hadoop入门 python hadoop入门实战

hadoop入门 java hadoop入门实战

hadoop入门2018 hadoop入门实战

hadoop实战入门

hadoop入门到实战（1）hive优化总结

Hadoop入门实战手册

Hadoop入门到实战（5）sql语句大全（详细）

hadoop 实战 pdf hadoop 入门实例

SparkStreaming入门到实战之(6)--sparkstreaming入门到实战

hadoop从入门到放弃 hadoop基础入门

hadoop从入门到实践 hadoop简单入门

hadoop从入门到精通 hadoop hadoop

Cassandra入门到实战

Nginx 入门到实战

hadoop入门到实战（6）hive常用优化方法总结

hadoop入门到实战（4）Hive知识思维导图

zookeeper入门到实战

Java入门到实战

nginx入门到实战

mongodb入门到实战