我为什么要学习大数据:因为我不喜欢现在国企的工作氛围,不看好这个行业,另外我通过多方渠道了解到,其中包括李笑来、凯文凯利、和各种新闻及文章,现在我们正处于大数据时代,我是一个不安于现状、喜欢探索顺应时代发展趋势学习新东西的人,希望通过努力来改变自己生活状态渴望成功的人,我喜欢与朝气蓬勃奋发向上的人一起活在未来。前言:一、背景介绍二、大数据介绍正文:一、大数据相关的工作介绍二、大数据工程师的技能要求            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2018-11-26 16:45:13
                            
                                169阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            2017年数据分析学习计划前言其实想写这篇文章很久了,一直在酝酿怎样写会更好一些。与其说是一篇计划书不如说是对过去的一些总结和对未来的期许。它是我下面执行的计划也是写给我自己看的一篇提醒。大一时我是一名资环学院的学生,然而我努力了挺久并没有喜欢上我原来的专业。所以我选择了转专业,我去了软件学院。其实进入软件学院我也是比较懵懂,我并不是很了解这个行业。 转过来很多软件学院的学生很诧异,觉得他们很多人            
                
         
            
            
            
            好久没更博了,说明学习进度太慢了。 一 实施目的用抓取的数据包做统计分析,分析出行为的特征信息,用于进一步的网络诊断 二 实现思路对已经抓取和解析的大量的数据包,进行数据清洗和初步过滤,处理成半结构化的数据,导入到HDFS分布式文件系统中,做进一步的统计分析、信息检索、快速查询。具体采用Hive做统计特征的计算,Hbase作为详细信息的快速查询,Splunk            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-01 20:50:14
                            
                                15阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            国好家好国家好,家家都好,国圆人圆国人圆,人人皆圆,把一份浓浓的思念,和一串串蜜蜜的祝福寄给所有关注互联互通社区的朋友们,国庆节快乐。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-10-09 14:50:01
                            
                                98阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                   大数据时代,业务量不断增长,大批量的数据离线同步已成了不可获缺的工具。 
    
         阿里云数据集成是开源DataX的服务化版本,支持400种异构数据源之间的数据同步,同时支持作业级别和数据源级别的流控、分布式并发运行以及脏数据阈值处理,是大数据处理中不可缺失的数据同步工具。            
                
         
            
            
            
            我上大学时那时候安卓的版本才到安卓4.4,在智能手机出来普及以前,各大网站的数据量并没有那么多,但是随着智能手机的普及,互联网巨头家里的数据呈现几何级增长,像什么微博,微信,视频网站的数据;需要找到合适的存储方式—>>分布式存储架构,可以水平扩展,实现存储数据类型多样化,二维可以实现高容错高吞吐量,轻松实现大文件存储(支持P级别的            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-15 11:01:42
                            
                                572阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据啊大数据!浪尖浪尖聊大数据开始本文之前,希望大家参与一下下面的投票。做这个投票的主要原因是最近经常有找浪尖咨询大数据,自学,培训及找工作的事情,问题归类如下:大数据要不要培训自学一段时间,发现很痛苦,没人指导想放弃,培训费用太高了培训发现跟不上,举步维艰培训结束了,为啥面试机会甚少下面分类回答一下。1.大数据需要培训吗?对于java老鸟,因为有比较强的编程经验,可以买点视频或者找大牛付费专栏            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-03-19 13:47:02
                            
                                10000+阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ClickHouse在版本20.6.3之后支持explain查看执行计划。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-09-25 00:25:55
                            
                                1015阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.大数据对思维方式的影响是使得分析全样而非抽样、效率而非精准、相关而非因果。 2.区别:大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活;云计算本质上旨在整合和优化各种IT资源,并通过网络以服务的方式廉价地提供给用户;物联网的发展目标是   实现物物相连,应用创新是物联网发展的核心。   联系:从整体上看            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-16 00:39:18
                            
                                318阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            今天听了一场报告会,是清华计算机系60周年系列讲座之一,主讲人是哈工大软院院长李建中教授,主题《计算和数据资源受限的大数据计算的复杂性理论与高效算法研究》,李老师介绍的大数据计算理论体系很...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-04-29 22:22:20
                            
                                2137阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大数据最全知识点整理-HBase篇基础问题:1、Hbase是什么2、Hbase架构3、Hbase数据模型4、Hbase和hive的区别5、Hbase特点6、数据同样存在HDFS,为什么HBase支持在线查询,且效率比Hive快很多7、Hbase适用场景8、RowKey的设计原则9、HBase中scan和get的功能以及实现的异同?10、Scan的setCache和setBatchsetCache            
                
         
            
            
            
            大数据框架 系统平台 Hadoop、CDH、HDP 监控管理 CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle 文件系统 HDFS、GPFS、Ceph、GlusterFS、Swift 、BeeGFS、Alluxio 资源调度 YARN、Mesos 协调框架            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-07-30 00:54:47
                            
                                954阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            看过来!!!2017年,大数据已经从概念走向落地;2019年,中低端IT工程师紧随浪潮加速向大数据转型,企业对大数据人才争夺直接进入白热化阶段。因此,对于想学IT技术的、想月入过万不是梦的人而言,我建议,直接选择学习大数据技术是符合潮流和就业需求的选择。一、大数据是什么?1、大数据简介一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-08 10:47:21
                            
                                192阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            近年来,伴随手机的普及以及移动互联网技术的迅猛发展,手机使用中产生的大数据资源的研究与应用价值受到学者们的重视。然而,合理开发、利用手机大数据的边界尚未确定,海量数据仍处于“沉睡”之中。忠实记录用户行为据2016年1月工信部发布的2015通信运营业统计公报,中国移动电话用户总数达13.06亿户。如此规模的移动电话用户群体将产生海量数据。同济大学建筑与城市规划学院副教授钮心毅介绍,手机数据包括通话详            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-22 19:43:20
                            
                                171阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据概述: 大数据的发展历程:第一阶段:萌芽期(20世纪90年代至21世纪初) 第二阶段:成熟期(21世纪前十年) 第三阶段:大规模应用期(2010年以后) 大数据的特点(简称4V):数据量大 数据类型多 处理速度快 价值密度低 大数据的特征:全面而非抽样 效率而非精确 相关而非因果 在科学研究上的四种范式: 实验科学、理论科学、计算科学、数据密集型科学大数据技术 主要包括数据采集与预处理、数据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-16 09:55:28
                            
                                135阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Spark-Core介绍计算引擎,类似MapReduce,将数据存放在内存中,减少磁盘IO,他是有scala编写的总体技术栈讲解Spark Streaming流式计算框架Spark GraphX图形计算引擎ML Base机器学习Spark SQL使用SQL处理业务优点更快易于使用Spark Sql支持多种环境运行模式Local多用于本地测试,如在 eclipse , idea 中写程序测试等。St            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-30 04:57:46
                            
                                76阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            各个行业的业务数据都运行在关系数据库中,但是历史数据的保存,数据分析和数据挖掘,需要准实时的从关系数据库导入到分布式数据库系统中。本文介绍了利用ISFRAME实现数据收集和备份的方法。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2013-06-01 18:44:35
                            
                                10000+阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、 Hadoop的来源 Hadoop是Google的集群系统的开源实现。 --Google集群系统:GFS(Google File System)、MapReduce、BigTable. --Hadoop主要由HDFS(Hadoop Distributed File System Hadoop分布            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-29 16:23:31
                            
                                10000+阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            8 大数据技术8.1 大数据及其特征典型大数据应用中的数据在如下的一个或多个(4V)方面与传统技术面对的数据表现出显著不同:数据量(Volume)大、类型(Variety)多样、速度(Velocity)快、价值(Value)高而密度稀疏。大数据技术的目标乃是简单、高效并安全地共享大数据,支持大数据应用。大数据技术的关键需求包括:①可伸缩性,能够有效处理越来越多的数据和越来越多的访问。②可靠性,能够            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-31 15:13:16
                            
                                224阅读