1、什么是虚拟化?
虚拟化,是指通过虚拟化技术将一台计算机虚拟为多台逻辑计算机。在一台计算机上同时运行多个逻辑计算机,每个逻辑计算机可运行不同的操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。

2、云计算与虚拟化的关系。
虚拟化是云计算的重要支撑技术。云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。通过虚拟化,可以将应用程序和数据在不同层次以不同的方式展现给客户,为云计算的使用者和开发者提供便利。云计算的虚拟化过程为组织带来了灵活性,从而改善IT运维和减少成本支出。

3、大数据技术是什么?
大数据技术是以数据为本质的新一代革命性的信息技术,在数据挖潜过程中,能够带动理念、模式、技术及应用实践的创新。也就是说从各种各样类型的数据中,快速获得有价值信息的能力

4、云计算平台OpenStack。
云计算平台也称为云平台。云计算平台可以划分为3类:以数据存储为主的存储型云平台,以数据处理为主的计算型云平台以及计算和数据存储处理兼顾的综合云计算平台。
云计算平台简单点来说,就是一个云端,是服务器端数据存储和处理中心,我们可以通过客户端进行操作,发出指令,而数据的处理会在服务器进行,然后将结果反馈给你,而云端平台数据可以共享,可以在任意地点对其进行操作,这样可以节省大量资源,而且云端可以同时对多个对象组成的网络进行控制和协调,云端各种数据可以同时被多个用户使用。
OpenStack是一个由NASA(美国国家航空航天局)和Rackspace合作研发并发起的,以Apache许可证授权的自由软件和开放源代码项目。
OpenStack支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack通过各种互补的服务提供了基础设施即服务(IaaS)的解决方案,每个服务提供API以进行集成。
OpenStack云计算平台,帮助服务商和企业内部实现类似于 Amazon EC2 和 S3 的云基础架构服务(Infrastructure as a Service, IaaS)。OpenStack 包含两个主要模块:Nova 和 Swift,前者是 NASA 开发的虚拟服务器部署和业务计算模块;后者是 Rackspace开发的分布式云存储模块,两者可以一起用,也可以分开单独用。
OpenStack是IaaS(基础设施即服务)组件,让任何人都可以自行建立和提供云端运算服务。此外,OpenStack也用作建立防火墙内的”私有云”(Private Cloud),提供机构或企业内各部门共享资源。

5、Hadoop平台与OpenStack的区别。
Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。
OpenStack是一个云计算平台,帮助服务商和企业内部实现类似于 Amazon EC2 和 S3 的云基础架构服务(Infrastructure as a Service, IaaS)。
区别:
a、
openstack仿照的Amazon的云,hadoop仿照的是Google的云
openstack注重的是虚拟化/虚拟机及其配套的服务,hadoop注重的是海量的数据分析和处理。
b、
OpenStack 主要目的是做一整套的云计算基础构架。包括 云计算(Compute), 网络(Network),对象存贮(Object Store),镜像文件存储 (Image),身份认证(Authentication),BlockStorage 以及 前端UI 。
OpenStack的每个模块都对外提供API,可以独立供云用户调用,在OpenStack内部,每个模块之间的相互调用也是用这些API.
而 Hadoop 是一个分布式数据库。举个例子:OpenStack 中 Object Store 模块可以选择用Hadoop来支持。如果把 Openstack 比作WIndows的话,Hadoop 相当于Sql Server。
c、
openstack是管理虚拟机的,比如xen,kvm等。它所谓的云就是一堆的虚拟机。
hadoop是负责分布式计算和分布式存储。就是把一个执行任务分开,放到不同的节点(物理机)去跑,最后汇总。
d、
OpenStack是IaaS(基础设施即服务)‎虚拟机管理软件,让任何人都可以自行建立和提供云端运算服务。
而hadoop是一个分布式文件系统+分布式计算平台的开源方案,侧重于hdfs云存储与mapreduce云数据分析等方面
e、
OpenStack主要做资源的虚拟化,Hadoop主要用来做超大数据处理,还可以做数据挖掘
f、
Openstack是把大机器虚拟成很多小机器从而达到大的分成小的来用,大大提高资源使用率。
Hadoop是把小机器合起来用,用于解决单台大机器无法解决的计算和存储等问题。
6、Hadoop实现的功能HDFS、MapReduce。
Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。
Hadoop主要完成两件事,分布式存储和分布式计算。
Hadoop主要由两个核心部分组成:
a.HDFS:分布式文件系统,用来存储海量数据。
b.MapReduce:并行处理框架,实现任务分解和调度。
HDFS是一个分布式文件系统,用来存储和读取数据的。文件系统都有最小处理单元,而HDFS的处理单元是块。HDFS保存的文件被分成块进行存储,默认的块大小是64MB。并且在HDFS中有两类节点:NameNode和DataNode。
MapReduce是并行处理框架,实现任务分解和调度。其实原理说通俗一点就是分而治之的思想,将一个大任务分解成多个小任务(map),小任务执行完了之后,合并计算结果(reduce)。