大家好,我是脚丫先生 (o^^o)最近和小伙伴们交流。有刚刚毕业的老弟陷入培训机构交2w无法自拔,有刚刚考上研的师弟大数据学习无从下手,有想转方向大数据行业的老哥...互联网时代,知识就像浩瀚的海洋,无边无际且波涛汹涌。回首自己自学大数据开发之时,又何尝不是呛了无数口海水。古之学者必有师,于是趁着闲暇之时给小伙伴们梳理大数据自学指南。前言我读研的时候,老板放羊的,而这正合我意。于是乎,我就拥有了无
转载 2023-11-28 11:51:02
95阅读
目录Linux系统与虚拟机SecureCRT的安装与Linux下jdk1.8的安装数据-Hadoop集群搭建(配置免密登录及配置环境)Linux系统与虚拟机SecureCRT的安装与Linux下jdk1.8的安装数据-Hadoop集群搭建(配置免密登录及配置环境)...
原创 2021-07-14 11:48:59
311阅读
如今大数据应用越来越广,对于大数据技术人才的需求越来越大,很多人想转行学习大数据,并想通过自学进入大数据行业,那么,大数据技术怎么自学?大数据开发如何自学?对于想学习大数据人员可分为以下三种;第一类: 零基础学员,对大数据行业和技术一无所知;第二类: 有一定的编程基础,对大数据行业略知一二,无发真正应该用;第三类: 有工作经验的工程师,对大数据行业了解,想转行大数据开发。在搞清楚了自身的状况之外,
原创 2018-08-01 18:08:29
479阅读
如今大数据应用越来越广,对于大数据技术人才的需求越来越大,很多人想转行学习大数据,并想通过自学进入大数据行业,那么,大数据技术怎么自学?大数据开发如何自学? 对于想学习大数据人员可分为以下三种;第一类: 零基础学员,对大数据行业和技术一无所知;第二类: 有一定的编程基础,对大数据行业略知一二,无发真正应该用;第三类: 有工作经验的工程师,对大数据行业了解,想转行大数据开发。在搞清楚了自身的状况之外
原创 2019-01-04 13:11:36
1039阅读
先留个问题~
原创 2023-04-01 08:05:42
89阅读
大数据解释凡是能被计算机处理的都是大数据的概念,并不仅是数学概念上的数据计量单位1G-》1T太->1P拍-->1E艾->1Z泽->1Y尧->1B布->1N诺->1D刀(1024进制)大数据主要特点A.大数据的来源多样:1.结构化2.非结构化3.半结构化B.大数据处理主要可以分为:1.离线处理-》主要对历史数据2.实时在线处理-》比如天猫双11当天的实时交易
原创 2021-03-09 20:51:51
467阅读
2018年,火爆的科技层出不穷,大数据、云计算、人工智能、区块链等等都被侃侃而谈。尤其是大数据工程师更是深受程序员的青睐,如此火爆的职业,吸引了大批有志青年的加入。但在加入之前,你仍需要一份详细的就业前景分析报告。作为中国官方重点扶持的战略性新兴产业,大数据产业已逐步从概念走向落地“大数据”和“虚拟化”两大热门领域得到了广泛关注和重视,90%企业都在使用大数据。财政大数据包括:公安大数据、质检大数
原创 2018-08-22 18:04:51
48阅读
这不得不让我去看看hadoop-env.sh中 到底配置了什么。下面启动NameNode 守护进程 和DataNode守护进程。启动失败了,报错了----ssh本地连接被拒绝,正在查找原因S。可以看到文件中有 NameNode和DataNode。启动之前先看一下 sbin文件夹下的内容。start-dfs.sh文件中的内容。1,设置java环境的。
原创 2023-03-15 07:56:57
90阅读
现在网上的学习资源很多,免费付费的都有,很多人提升自己的方法会选择自学。零基础小白想入门大数据,前期打基础的部分是可以自学的。1.英语基础对于大数据技术文章,比较先进的是外文较多,编程也需要能看懂代码,必须要有一定的英语能力。2.统计学主要是大数据分析、数据挖掘方向的工作需要。重点学习:基本的统计量、概率分布、置信区间与假设检验、相关性与回归分析等。推荐书籍:《赤裸裸的统计学》、《深入浅出统计学》
原创 2019-08-13 16:22:02
402阅读
转载 2021-09-01 10:16:50
35阅读
大数据系列文章知识点理解大数据相关概念、特点、应用场景掌握大数据业务分
原创 2023-01-12 11:02:19
113阅读
大数据技术原理与应用——大数据处理架构 Hadoop1.概述(1)Hadoop 简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System) 和 M
好程序员大数据学习路线之大数据自学路线二lambda表达式 比较lambda表达式和匿名内部类: lambda表达式就是简单的匿名内部类 匿名内部类可以为任意接口创建实例,不管接口有多少抽象方法; lambda表达式只能为函数式接口创建实例(即只能有一个抽象方法)  基本语法:  (参数)->表达式、(参数)->{方法体;}  1.形参:形参列表允许省略形参类型,若形参列表中只有一个参
原创 2019-09-18 10:39:25
507阅读
好程序员大数据学习路线之大数据自学路线一System类exit():终止虚拟机gc():运行垃圾回收机制currentTimeMillis():返回以毫秒为单位的当前时间arraycopy(Object src,int srcPos, Object dest,int destPos,int length):从指定源数组中复制一个数组,复制从指定的位置开始,到目标数组的指定位置结束String不可变
原创 2019-09-18 10:18:43
352阅读
海量数据分成两块,一是系统建设技术,二,海量数据应用。先说系统建设,现在主流的技术是HADOOP,主要基于mapreduce
原创 2023-06-27 16:58:36
60阅读
我们在HDFS系统中删除文件,其实就像是在win/linux中,文件先被放进回收站;如果在 Ha
原创 2023-03-15 07:57:58
67阅读
1,逻辑上分离~集群之间没有依赖,互不影响2,某些进程往往部署在一台服务器码层面的处理逻辑
原创 2023-03-15 07:58:22
90阅读
随着数据量的增多,数据的类型也不像原来那样都是结构化数据,还有非结构化
原创 2023-03-25 07:58:52
82阅读
     最近在整理整理java大数据处理这一系列的文章,在网上发现一个java写excel文件的方式,非常的有技巧,并且性能非常高,我在自己机器上简单的操作了一下,感觉非常的棒 这里就把这个方法和大家分享一下,一起讨论一下这种方式的成熟度. 简单说明   1、核心原理-查看excel的"源代码" 找到数据
转载 2023-06-13 22:45:31
164阅读
写入该文件,每行一个,默认localhost(即把本机(namenode也作为数据节点),所以我们在伪分
原创 2023-03-15 08:36:22
146阅读
  • 1
  • 2
  • 3
  • 4
  • 5