大家好,我是脚丫先生 (o^^o)最近和小伙伴们交流。有刚刚毕业的老弟陷入培训机构交2w无法自拔,有刚刚考上研的师弟大数据学习无从下手,有想转方向大数据行业的老哥...互联网时代,知识就像浩瀚的海洋,无边无际且波涛汹涌。回首自己自学大数据开发之时,又何尝不是呛了无数口海水。古之学者必有师,于是趁着闲暇之时给小伙伴们梳理大数据自学指南。前言我读研的时候,老板放羊的,而这正合我意。于是乎,我就拥有了无            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-28 11:51:02
                            
                                95阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录Linux系统与虚拟机SecureCRT的安装与Linux下jdk1.8的安装数据-Hadoop集群搭建(配置免密登录及配置环境)Linux系统与虚拟机SecureCRT的安装与Linux下jdk1.8的安装数据-Hadoop集群搭建(配置免密登录及配置环境)...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-14 11:48:59
                            
                                311阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            如今大数据应用越来越广,对于大数据技术人才的需求越来越大,很多人想转行学习大数据,并想通过自学进入大数据行业,那么,大数据技术怎么自学?大数据开发如何自学?对于想学习大数据人员可分为以下三种;第一类: 零基础学员,对大数据行业和技术一无所知;第二类: 有一定的编程基础,对大数据行业略知一二,无发真正应该用;第三类: 有工作经验的工程师,对大数据行业了解,想转行大数据开发。在搞清楚了自身的状况之外,            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2018-08-01 18:08:29
                            
                                479阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            如今大数据应用越来越广,对于大数据技术人才的需求越来越大,很多人想转行学习大数据,并想通过自学进入大数据行业,那么,大数据技术怎么自学?大数据开发如何自学? 对于想学习大数据人员可分为以下三种;第一类: 零基础学员,对大数据行业和技术一无所知;第二类: 有一定的编程基础,对大数据行业略知一二,无发真正应该用;第三类: 有工作经验的工程师,对大数据行业了解,想转行大数据开发。在搞清楚了自身的状况之外            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2019-01-04 13:11:36
                            
                                1039阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            先留个问题~            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-04-01 08:05:42
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据解释凡是能被计算机处理的都是大数据的概念,并不仅是数学概念上的数据计量单位1G-》1T太->1P拍-->1E艾->1Z泽->1Y尧->1B布->1N诺->1D刀(1024进制)大数据主要特点A.大数据的来源多样:1.结构化2.非结构化3.半结构化B.大数据处理主要可以分为:1.离线处理-》主要对历史数据2.实时在线处理-》比如天猫双11当天的实时交易            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-03-09 20:51:51
                            
                                467阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            2018年,火爆的科技层出不穷,大数据、云计算、人工智能、区块链等等都被侃侃而谈。尤其是大数据工程师更是深受程序员的青睐,如此火爆的职业,吸引了大批有志青年的加入。但在加入之前,你仍需要一份详细的就业前景分析报告。作为中国官方重点扶持的战略性新兴产业,大数据产业已逐步从概念走向落地“大数据”和“虚拟化”两大热门领域得到了广泛关注和重视,90%企业都在使用大数据。财政大数据包括:公安大数据、质检大数            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2018-08-22 18:04:51
                            
                                48阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            这不得不让我去看看hadoop-env.sh中 到底配置了什么。下面启动NameNode 守护进程 和DataNode守护进程。启动失败了,报错了----ssh本地连接被拒绝,正在查找原因S。可以看到文件中有 NameNode和DataNode。启动之前先看一下 sbin文件夹下的内容。start-dfs.sh文件中的内容。1,设置java环境的。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-15 07:56:57
                            
                                90阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            现在网上的学习资源很多,免费付费的都有,很多人提升自己的方法会选择自学。零基础小白想入门大数据,前期打基础的部分是可以自学的。1.英语基础对于大数据技术文章,比较先进的是外文较多,编程也需要能看懂代码,必须要有一定的英语能力。2.统计学主要是大数据分析、数据挖掘方向的工作需要。重点学习:基本的统计量、概率分布、置信区间与假设检验、相关性与回归分析等。推荐书籍:《赤裸裸的统计学》、《深入浅出统计学》            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2019-08-13 16:22:02
                            
                                402阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                         
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-09-01 10:16:50
                            
                                35阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据系列文章知识点理解大数据相关概念、特点、应用场景掌握大数据业务分            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-01-12 11:02:19
                            
                                113阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据技术原理与应用——大数据处理架构 Hadoop1.概述(1)Hadoop 简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System) 和 M            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-12 14:44:57
                            
                                127阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            好程序员大数据学习路线之大数据自学路线二lambda表达式 比较lambda表达式和匿名内部类: lambda表达式就是简单的匿名内部类 匿名内部类可以为任意接口创建实例,不管接口有多少抽象方法; lambda表达式只能为函数式接口创建实例(即只能有一个抽象方法)  基本语法:  (参数)->表达式、(参数)->{方法体;}  1.形参:形参列表允许省略形参类型,若形参列表中只有一个参            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2019-09-18 10:39:25
                            
                                507阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            好程序员大数据学习路线之大数据自学路线一System类exit():终止虚拟机gc():运行垃圾回收机制currentTimeMillis():返回以毫秒为单位的当前时间arraycopy(Object src,int srcPos, Object dest,int destPos,int length):从指定源数组中复制一个数组,复制从指定的位置开始,到目标数组的指定位置结束String不可变            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2019-09-18 10:18:43
                            
                                352阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            海量数据分成两块,一是系统建设技术,二,海量数据应用。先说系统建设,现在主流的技术是HADOOP,主要基于mapreduce            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-06-27 16:58:36
                            
                                60阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            我们在HDFS系统中删除文件,其实就像是在win/linux中,文件先被放进回收站;如果在 Ha            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-15 07:57:58
                            
                                67阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1,逻辑上分离~集群之间没有依赖,互不影响2,某些进程往往部署在一台服务器码层面的处理逻辑            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-15 07:58:22
                            
                                90阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            随着数据量的增多,数据的类型也不像原来那样都是结构化数据,还有非结构化            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-25 07:58:52
                            
                                82阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
                 最近在整理整理java大数据处理这一系列的文章,在网上发现一个java写excel文件的方式,非常的有技巧,并且性能非常高,我在自己机器上简单的操作了一下,感觉非常的棒 这里就把这个方法和大家分享一下,一起讨论一下这种方式的成熟度. 简单说明   1、核心原理-查看excel的"源代码" 找到数据存            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-13 22:45:31
                            
                                164阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            写入该文件,每行一个,默认localhost(即把本机(namenode也作为数据节点),所以我们在伪分            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-15 08:36:22
                            
                                146阅读
                            
                                                                             
                 
                
                                
                    