什么是大数据? 用于①数据的存储:分布式文件系统(分布式存储)②数据的计算:分布式计算。简单一点就是存储和计算的问题,解决日常海量数据的分析。

学习大数据需要什么基础呢? Java基础(Javase):类、类、继承、I/O、反射、泛型等; Linux基础(Linux的操作):创建文件、目录、vi编辑器的使用;

Java和大数据都有哪些关系呢? ** 基于Java语言开发→→→ Hadoop体系结构、原理、编程 第一阶段:HDFS、MapReduce、HBase(NoSQL数据库) 第二阶段:数据分析引擎 ---> Hive、Pig 数据采集引擎 ---> Sqoop、Flume 第三阶段:HUE:Web管理工具 ZooKeeper:实现Hadoop的HA Oozie: 工作流引擎* ** 基于Java语言开发→→→Scala语言→→→Spark Spark的学习 第一个阶段:Scala编程语言 第二个阶段:Spark Core-----> 基于内存,数据的计算 第三个阶段:Spark SQL -----> 类似Oracle中的SQL语句 第四个阶段:Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂

Apache Storm:类似Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂 NoSQL:Redis基于内存的数据库