企业虽然认识到大数据分析能给企业带来发展的价值,但传统的数据管理和安全问题已经阻碍了大数据的部署。企业在什么情况下适合大数据,这是由企业处于发展中的位置决定的。
大数据热潮才真正开始于Apache Hadoop的分布式文件系统(HDFS),开启了基于使用相对便宜的本地磁盘群集的作为海量数据分析的时代。不管企业发展如何迅速,Hadoop及其相关大数据的解决方案,都可以保证持续分析各种原始数据。
hadoop是目前流行最广泛的大数据技术,同时也是以java为基础,支持开源,当然我们java程序员学习的首选。其他的大数据技术:Teradata、Sybase IQ(被SAP收购)和Vertica(被HP收购)等。
hadoop重要的子项目:Hbase,Hive
namenode记录个节点信息,单节点,secondnode辅助节点,定期保存namenode信息,单点,jobtracker单节点;masternode。
datanode数据节点(数据与任务放在同一节点);每一个节点只有一个tasktracker,但一个tasktracker可以启动几个jvm,并行处理任务。
配置centOS联网
1、安装虚拟机,安装centos
设置虚拟机的网络适配器 为nat(Network Address Translation,网络地址转换)
NAT方式只要主机Host能够上网,小小设置一下,VMware也能上网
NAT不仅能解决了lP地址不足的问题,而且还能够有效地避免来自网络外部的攻击,隐藏并保护网络内部的计算机。
VM软件安装好后,就有10个网络连接类型可供选择。分别是:VMnet0、VMnet1、VMnet2、VMnet3、VMnet4、VMnet5、VMnet6、VMnet7、VMnet8、VMnet9。
VM虚拟机常用的三种网络连接方式默认:桥接(bridge)用的是VMnet0,NAT用的是VMnet8,host-only用的是VMnet1。
1、桥接:就是把虚拟机通过VMnet0桥接到主机的本地连接。
虚拟机是通过VMnet0与外界联系,现在的虚拟机就相当于和主机一样是物理网络中的一台电脑,说的通俗的就是现在虚拟机就相当于和你主机同在一个网络的另一台真实的电脑。所以要想使用桥接使虚拟机上网,前提必须你的主机处在局域网中,也就是你的主机上网得有路由器,这时才能用桥接使虚拟机上网。至于虚拟机的IP设置方式和你主机一样,用不用设置IP要看你的路由器是否开启了DHCP和DNS,主机不用虚拟机也不用,主机要设置那么虚拟机也要设置。对于那些使用拨号上网方式并且没用路由器的就不要用桥接。
2、NAT:就是网络地址转换,通过VMnet8连接作为网关使虚拟机经过主机上网。
虚拟机是通过VMnet8与外界联系,说的通俗的就是在你的主机和虚拟机之间加了一个路由器,虚拟机通过这个路由器上网。NAT方式就不用考虑那么多,只要你主机能上网虚拟机就能上网,所以一般没有特殊要求推荐用NAT方式。
3、host-only:就是虚拟机和主机在一个私有网络中。
这时虚拟机只能和主机通讯,默认它是不能上网的。(当然不是绝对的,要想上网不过要进行另外的设置)
以上只是简单的介绍了VM虚拟机常用的三种网络连接方式,一般用NAT方式虚拟机就很容易上网的,所以一般没有特殊要求推荐用NAT方式。
打开控制面板的网络连接,现在是这样的(可以不管):
原因:VMware Network Adapter VMnet1和VMnet8 被防火墙认定为未识别的网络,阻隔,无法使用端口映射,虚拟机的80端口无法传入,数据包只能出不能入。且公用网络被限制不能修改为家庭或工作网络。
解决方法:
1,进入注册表[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Class\{4D36E972-E325-11CE-BFC1-08002BE10318}],先导出做备份。
2,逐项查看其下的[项](0000,0001至00xx),看右边哪一项的[值]为:"DriverDesc"="VMware Virtual Ethernet Adapter for VMnet1"。
3,找到后,新建一个“DWORD”值(32位),名称为“*NdisDeviceType”(*号是必须的),数据值改为“1”。(一定要32位)
4,同理再找 VMnet8 ,再重复第2~3步,添加值。
完成后重启windows即可。
但是还是不能上网:
[skx2@skx2 Desktop]$ ping www.baidu.com
ping: unknown host www.baidu.com
恢复默认设置
点击是,等待安装完成,重启vm
现在能上网的了:
[skx2@skx2 Desktop]$ ping www.baidu.com
PING www.a.shifen.com (58.217.200.37) 56(84) bytes of data.
64 bytes from 58.217.200.37: icmp_seq=1 ttl=128 time=32.7 ms查看自己的ip:
[skx2@skx2 Desktop]$ ifconfig
eth0 Link encap:Ethernet HWaddr 00:0C:29:7D:53:91
inet addr:192.168.159.128 Bcast:192.168.159.255 Mask:255.255.255.0不设置inet就是默认的128,设置为自己想固定的ip地址
参看:http://icyleaf.com/2013/09/network-configuration-in-centos/
Centos安装vim
Centos里的VI只默认安装了vim-minimal-7.x。所以无论是输入vi或者 vim查看文件,syntax功能都无法正常启用。因此需要用yum安装另外两个组件:vim-common-7.x和vim-enhanced- 7.x。
命令行里敲入:
yum -y install vim*
运行;
vi /etc/sysconfig/network-scripts/ifcfg-eth0
按一下 a 键,进入输入模式,
在之前每一句之前输入 # ,这样就将原来的语句注释掉了
增加语句,
首先,进入输入模式,将光标语句最后一行另起一行,将语句复制过去就可以了。
最后,按 ESC键,退出输入模式,输入:wq,回车,保存文件,OK!
以管理员su进入,修改如下:
DEVICE="eth0"
BOOTPROTO="static"
GATEWAY="192.168.1.1"
IPADDR="192.168.159.131"
HWADDR="00:0C:29:7D:53:91"
IPV6INIT="yes"
NM_CONTROLLED="yes"
ONBOOT="yes"
TYPE="Ethernet"
UUID="0118dce9-bdf0-4103-9baf-16b1269027dd"
:wq
查看ip地址:
inet addr:192.168.159.131 Bcast:192.168.159.255 Mask:255.255.255.0
同理,再添加两台虚拟机,IP地址为132,133。
今天一室友搬走了,自己用网线连接上网,ip为192.168.1.2
结果出现了:虚拟机不能ping通主机,主机可以ping通虚拟机
打开虚拟机 -->编辑-->虚拟网络编辑器
发现这里的网关并不是上面设置的192.168.1.1而是192.168.159.2
去修改vi /etc/sysconfig/network-scripts/ifcfg-eth0
修改:
DNS1="192.168.159.2"
GATEWAY="192.168.159.2"service network restart
[root@skx1 Desktop]# ping 192.168.1.2
PING 192.168.1.2 (192.168.1.2) 56(84) bytes of data.
64 bytes from 192.168.1.2: icmp_seq=1 ttl=128 time=0.704 ms说明虚拟机能ping通主机了!
也能ping百度了;
附:系统重启后dns丢失的解决办法,是因为没有设置DNS信息:
输入 cat /etc/resolv.conf
提示:No nameservers found; try putting DNS servers into your
如果手动修改该文件: vi /etc/resolv.conf重启后又恢复no nameservers了;
解决方法:
修改vi /etc/sysconfig/network-scripts/ifcfg-eth0
添加:
DNS1="192.168.1.1"
service network restart
再查看 cat /etc/resolv.conf
[root@skx1 Desktop]# cat /etc/resolv.conf
# Generated by NetworkManager
search localdomain
nameserver 192.168.1.1
ping www.baidu.com