Hadoop博客_原创博文第14页

hadoop 每秒 hadoop速成

#1-2 基本概念1.Hadoop 在某种程度上将多台计算机组织成了一台计算机（做同一件事），那么 HDFS 就相当于这台计算机的硬盘，而 MapReduce 就是这台计算机的 CPU 控制器。2. Hadoop 支持在单个设备上运行，主要有两种模式：单机模式和伪集群模式.3.Hadoop 主要包含 HDFS 和 MapReduce 两大组件，HDFS 负责分布储存数据，MapReduc

hadoop 每秒

hadoop

大数据

mapreduce

python

mob64ca1414c613

2月前

376阅读

hadoop 集群挂掉了如何重启

Hadoop集群安装　　首先我们统一一下定义，在这里所提到的Hadoop是指Hadoop Common，主要提供DFS（分布式文件存储）与Map/Reduce的核心功能。　　Hadoop在windows下还未经过很好的测试，所以笔者推荐大家在linux（cent os 5.X）下安装使用。　　准备安装Hadoop集群之前我们得先检验系统是否安装了如

hadoop 集群挂掉了如何重启

hadoop

集群

ssh

jdk

技术博客领航者

2月前

421阅读

Hadoop配置高可用集群 hadoop namenode高可用

hadoop 高可用为什么 NameNode 需要高可用– NameNode 是 HDFS 的核心配置,HDFS 又是Hadoop 的核心组件,NameNode 在 Hadoop 集群中至关重要,NameNode机器宕机,将导致集群丌可用,如果NameNode 数据丢失将导致整个集群的数据丢失,而 NameNode 的数据的更新又比较频繁,实现 NameNode 高可用势在必行为什么 NameNo

Hadoop配置高可用集群

hadoop

zookeeper

HDFS

互联网小墨风

2月前

371阅读

impala报错的告警脚本

import requests import json from datetime import datetime, timedelta import pytz import time import re from requests.auth import HTTPBasicAuth # 配置项 CDH_API_URL = "http://192.168.0.10:7180/api/v33/cl

json

API

错误类型

原创

江南独孤客

2月前

89阅读

hadoop模拟机运行

1、Hama概论 ·建立在Hadoop上的分布式并行计算模型。 ·基于 Map/Reduce 和 Bulk Synchronous 的实现框架。 ·运行环境需要关联 Zookeeper、HBase、HDFS 组件。 ·集群环境中的系统架构由 BSPMaster/GroomServer(Computation Engine)、Zookeeper(Dis

hadoop模拟机运行

大数据

人工智能

系统架构

Google

ganmaobuhaowan

2月前

429阅读

编译hadoop源码冲突

2.1下载地址1、ApacheHadoop（100%永久开源）下载地址：- http://hadoop.apache.org/releases.html - SVN：http://svn.apache.org/repos/asf/hadoop/common/branches/2、CDH（ClouderaDistributed Hadoop，100%永久开源）下载地址： &nb

编译hadoop源码冲突

hadoop

编译

yarn

64位

技术领航探索者

2月前

345阅读

hadoop免费的发行版

看新闻很累？看技术新闻更累？试试下载InfoQ手机客户端，每天上下班路上听新闻，有趣还有料！\ \\ 近日，腾讯主导的Apache Hadoop2.8.4最新版本发布，为国内科技公司在国际开源领域的探索迈出重要一步。\\ 2006年Apache Hadoop发布，2008年Hadoop成为Apache顶级项目。在那时，中国移动、百度、淘宝等都已经开始使用Hadoop技术。Hadoop现在早

hadoop免费的发行版

人工智能

大数据

操作系统

Apache

蓝梦之翼

2月前

365阅读

ubuntu中开始测试hadoop的指令

最近没什么事，就使用之前测试openstack的机器，测试一下hadoop，看看他到底是干嘛的？测试环境为ubuntu 12.04 64位系统，hadoop版本是1.1.0下面是安装过程 1、安装jdk apt-get install openjdk-7-jdk 安装完成后测试一下 1. root@openstack:~/had

大数据

java

runtime

hadoop

HDFS

智能领航员

2月前

416阅读

hadoop升级log4j详细步聚

1.先贴个Hadoop官方说明先贴出Apache Hadoop官方版本说明（至今2014-07-07）：1.2.X - current stable version, 1.2 release2.4.X - current stable 2.x version0.23.X - similar to 2.X.X but missing NN HA.但是网上一搜一大把的0.20.X和0.23.X又有

hadoop升级log4j详细步聚

hadoop

Hadoop

mapreduce

mob64ca14133dc6

2月前

407阅读

Hadoop最低安装配置

一、环境准备1- 三台linux机器（本例为虚拟机）机器1 192.168.234.129 master 主机 --namecode机器2 192.168.234.130 node1 主机 --secondarynamecode and datacode机器3 192.168.234.131 node2 主机 --datacode 查询master主机的操

Hadoop最低安装配置

大数据

运维

java

hadoop

bigrobin

2月前

411阅读

hadoop启动 datenode

如果大家在安装的时候遇到问题，或者按步骤安装完后却不能运行Hadoop，那么建议仔细查看日志信息，Hadoop记录了详尽的日志信息，日志文件保存在logs文件夹内。无论是启动，还是以后会经常用到的MapReduce中的每一个job，以及HDFS等相关信息，Hadoop均存有日志文件以供分析。 1、hadoop-root-datanode-master.log 中有如下错误：

hadoop启动 datenode

hadoop

hdfs

Hadoop

技术领航舵手

2月前

385阅读

mac终端装Hadoop mac终端安装

本篇文章记录如何安装并且美化 macOS 的 Terminal 环境，让平常工作起來更高效。本篇文章会安装软件：homebrewitem2oh-my-zsh插件:zsh-autosuggestionszsh-syntax-highlighting写在前面：所有命令都在终端app里执行即可1. 安装HomebrewHomebrew 是一款在 macOS 上主流的套件管理工具，打开 Terminal

mac终端装Hadoop

git

运维

github

vim

码海航行侠

2月前

363阅读

物联网的存储支撑有hadoop

产业互联网具有打破信息不对称、增强供应链住处透明、降低交易成本、促进专业化分工、提高生产效率的特点，大力发展产业互联网将会倒逼企业进行创新，带动信息技术创新。产业互联网对产业链的重塑，我们将整个产业链简化为生产过程、交易过程与中间过程三个环节，生产环节主要涉及产品及中间产品的生产，交易过程涵盖产品与产成品的交易，而中间过程则包含伴随着生产与交易而产生的数据流、物流、资金流等一系列过程

物联网的存储支撑有hadoop

数据

大数据

产业互联网

mob64ca14038b36

2月前

352阅读

hadoop消息队列

一、针对hadoop集群的磁盘配置建议针对datanode,建议采用一组单独的磁盘，针对namenode节点，建议采用raid5或raid1来实现针对metadata的冗灾。二、针对此问题讨论的资料两篇文章从不同角度论证为什么Hadoop更青睐JBOD而不是RAID-0。分别是：Steve Loughran所撰写的《Why

hadoop消息队列

大数据

运维

python

Hadoop

架构设计师

3月前

398阅读

hadoop组件监控大屏

开始聊mapreduce，mapreduce是hadoop的计算框架，我学hadoop是从hive开始入手，再到hdfs，当我学习hdfs时候，就感觉到hdfs和mapreduce关系的紧密。这个可能是我做技术研究的思路有关，我开始学习某一套技术总是想着这套技术到底能干什么，只有当我真正理解了这套技术解决了什么问题时候，我后续的学习就能逐步的加快，而学习hdfs时候我就发现，要理解hadoop框

hadoop组件监控大屏

hadoop

mapreduce

apache

风华绝代的java

3月前

425阅读

搭建Hadoop平台的主要步骤及截图

原文转自详细从零记录Ubuntu16.04.1 3台服务器上Hadoop2.7.3完全分布式集群部署过程。包含，Ubuntu服务器创建、远程工具连接配置、Ubuntu服务器配置、Hadoop文件配置、Hadoop格式化、启动。主机名/hostnameIP角色hadoop1192.168.193.131ResourceManager/NameNode/SecondaryNameNodehadoop2

搭建Hadoop平台的主要步骤及截图

hadoop集群

分布式

ssh

虚拟机

编程之翼

3月前

354阅读

hadoop使用mapreduce实现单词统计 mapreduce单词统计过程

资源文件file.txt hello Hadoop hello word this is my first hadoop program 分析：一个文档中每行的单词通过空格分割后获取，经过map阶段可以将所有的单词整理成如下形式： key:hello value:1 key:hadoop value:1 key:hello value:1 key:word value:1 k

hadoop

键值对

Text

时光机3号

3月前

416阅读

学习hadoop 得心得体会 hadoop课程总结

Hadoop生态系统配置Hadoop运行环境Hadoop系统架构HDFS分布式文件系统MapReduce分布式计算(MapReduce项目实战)使用脚本语言Pig(Pig项目实战)数据仓库工具Hive(Hive项目实战)无限大表数据库HBaseYARN架构数据处理－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－＃include <bitcoi

学习hadoop 得心得体会

hadoop

Hadoop

HDFS

mob64ca140ee96c

3月前

412阅读

Hadoop hive中ODS层是数据文件还是表 hadoop表示层的包

一、概述 hadoop2的设计细想比hadoop1进步了很多，毕竟hadoop1是几年前的东西了。软件设计的理论在这几年中发展很快，出现了很多的软件设计理论如：领域驱动模型、事件驱动模型、状生命周期管理等，也出现了很多的开源的解决方案，当然开源的方案很多都是起源apache社区。在hadoop2中，采取了maven的工程管理结构，把以前的单一工程换成了多工程结构模式，现在估计有45个（pom.

hadoop

mapreduce

依赖关系

mob64ca13ffd0f1

3月前

360阅读

检查Hadoop是否正常启动的命令

问题重现1.通过Ambari界面看到HDFS有如下警告点开来具体查看发现Active NameNode和Stanby NameNode都有上一次检查点的告警。2问题解决1.执行以下命令手动保存一次HDFS的检查点[root@ip-172-31-4-109 ~]# sudo -u hdfs hdfs dfsadmin -safemode enter Safe mode is ON in ip-172

检查Hadoop是否正常启动的命令

HDFS

检查点

hdfs

网络小墨

3月前

403阅读

2CL4512-ASEMI高压快恢复二极管2CL4512

2CL4512

ASEMI

高压二极管

原创

我就是不长肉而已

3月前

100阅读

在51CTO的第一篇博文

2CL3516-ASEMI工业控制设备专用2CL3516

2CL3516

ASEMI

高压二极管

原创

我就是不长肉而已

3月前

49阅读

在51CTO的第一篇博文

请比较mapreduceHadoopspark三个平台的优点和缺点 mapreduce和spark各自优缺点

MapReduce为大数据挖掘提供了有力的支持，但是复杂的挖掘算法往往需要多个MapReduce作业才能完成，多个作业之间存在着冗余的磁盘读写开销和多次资源申请过程，使得基于MapReduce的算法实现存在严重的性能问题。后起之秀Spark得益于其在迭代计算和内存计算上的优势，可以自动调度复杂的计算任务，避免中间结果的磁盘读写和资源申请过程，非常适合数据挖掘算法。腾讯TDW Spark平台基于社区

大数据

spark

hadoop

MapReduce

HDFS

killads

3月前

424阅读

请比较mapreduceHadoopspark三个平台的优点和缺点 mapreduce和spark各自优缺点

HDFS目录配额（quota）不足导致写文件失败

本文分享自天翼云开发者社区《HDFS目录配额（quota）不足导致写文件失败》，作者：5****m问题背景与现象给某目录设置quota后，往目录中写文件失败，出现如下问题“The DiskSpace quota of /tmp/tquota2 is exceeded”。[omm@189-39-150-115 client]$ hdfs dfs -put switchuser.p

hadoop

大数据

天翼云开发者社区

3月前

76阅读

hadoop datanode数据不平均 hadoop ping 不通

问题1、虚拟机安装hadoop，windows通过主机名打不开hadoop的web页面 http://master:50070/无法访问。 windows ping master也ping不通方法： windows本机C:\Windows\System32\drivers\etc\hosts文件下

hadoop

java

Hadoop

编程之翼

3月前

414阅读

2CL71A-ASEMI工业领域核芯组件2CL71A

2CL71A

ASEMI

高压二极管

原创

我就是不长肉而已

3月前

78阅读

在51CTO的第一篇博文

dolphinscheduler 配置hadoop dolphinscheduler安装部署

一、版本海豚调度器还是一款比较不错的可视化调度器，但是感觉维护的人有点少，完善度差点。笔者主要用的版本为2.0.5版，之前下载过3.1.0，但是3.1.0有个小bug，后来又退回到2.0.5版本二、安装官网有很详细的安装教程，附Dolphinscheduler-2.0.5链接如下：Dolphinscheduler-2.0.5使用及安装连接 https://dolphinscheduler.apac

hadoop

hdfs

大数据

官网

mysql

killads

3月前

500阅读

dolphinscheduler 配置hadoop dolphinscheduler安装部署

CL01-12-ASEMI微波炉领域核芯元件CL01-12

CL01-12

ASEMI

高压二极管

原创

我就是不长肉而已

3月前

67阅读

在51CTO的第一篇博文

hadoop 节点角色 hadoop节点启动不全

问题导读：1、hadoop 完全分布式和伪分布式下 datanode无法启动的原因？ 2、怎么解决？问题描述：在集群模式下更改节点后，启动集群发现 datanode一直启动不起来。我集群配置：有5个节点，分别为master slave1-5 。在master以hadoop用户执行：start-all.sh jps查看master节点启动情况： NameNod

hadoop 节点角色

linux

hadoop

ubuntu

hdfs

blueice

3月前

381阅读

hadoop 任务syslog部分不显示

Hbase 前言：说到Hbase个人理解就是一个新类型的数据库，和传统数据库有很大的区别，但是也离不开传统数据库的存储模式。处理数据量很大，实时性，hbase可以说只有两个字段，rowkey和column family（列族），当然这是简单的说法。下面的图片是hbase的架构图可以说明在hadoop中充当的角色。以下总结一下hbase的内容Hbasehbase是数据库特

hbase 查询

hbase查询

hbase查询语句

IT独行侠

3月前

344阅读