在windows下通过安装cygwin模拟linux环境。然后再安装hadoop。是一种简单方便的方式。为hadoop准备的windows下cygwin环境安装步骤例如以下:

- 下载安装文件

最新的cygwin安装文件setup.exe下载地址在这里用最新版本号的cygwin就能够,我用的是2.774版本号的安装程序。

- 安装cygwin

在上一步下载的setup.exe文件实际上仅仅是一个引导安装和下载过程的运行文件。真正的下载安装过程是通过网络进行的,以下让我们将下载的setup.exe运行起来。

点击下一步进入安装模式引导界面。

这里面的三个选项是“从网络下载并安装”、“仅仅下载不安装”、“从本地下载文件安装”,简单粗暴地选择第一个“从网络下载并安装”,点击下一步后进入选择安装文件夹界面。

既然cygwin贴心地帮我选择了一个简单明了的c盘文件夹,那就用它吧,以下的同意那些用户使用,就用默认的全部本机用户都能使用。点击下一步进入下载文件存放文件夹选择界面。

鄙人稍有文件洁癖。选择让下载文件放到经常使用的暂时文件文件夹下,点击下一步(假设输入的是一个不存在的文件夹。程序会提示你是否要创建这个文件夹。选yes就ok)。进入网络链接选择界面。

Cygwin的安装眼下还没有FQ的须要,假设没有特别的速度的考虑,就选Direct Connection直接连接就好了,点击下一步后会有一个下载安装文件镜像server列表的短暂过程,然后会出现选择安装文件镜像server的界面。

按说选择第一个163的server应该是最快的,可是我选择后出现了setup文件下载出错的情况,导致安装不能完毕。后来选择了第二个box-soft.comserver。方才顺利完毕安装,下载速度也还能够,能稳定在100k左右。

点击下一步后,仍然会有一个短暂的从所选server下载安装组件列表的过程,然后出现选择安装组件的界面

选择安装组件的步骤比較重要。须要细致选择下面组件(:

* Base组件的所有。操作方法是点击Base后面的Default,变为Install)

* Devel组件下的subversion及其它将来开发须要用到的组件。比如autoconf等,操作方法是展开Devel组件,点击各个小组件前的Keep文字,变为对应的版本。

* Net组件下的openssh和openssl组件,用于hadoop须要的ssh訪问。操作方法同上。

* System组件下的util-linux组件,用于使用一些经常使用的more等功能进行调试,操作方法同上。

* 其它一些可能用到的组件,我还单独选择了Perl、Python、Ruby、Science等组件。

选择组件完毕后。点击下一步即開始进行下载、安装等自己主动步骤。一路选择下一步就可以。

- 配置cygwin的ssh服务

Cygwin安装完毕后。须要对ssh服务进行配置。以执行hadoop环境进行ssh无password登录。步骤例如以下:

* 使用安装后生成的cygwin启动快捷方式。启动cygwin环境。

* 运行cygwin的ssh-host-config。

在第一步询问“Should privilege separation be used?(yes/no)”时。输入yes;

在第二步询问“(Say "no" if it is alreadyinstalled as a service) (yes/no)”时,输入yes;

在第三步询问“Enter the value of CYGWIN for thedaemon: []”,直接回车。

看到“Host configuration finished. Have fun!”后此步即完毕。

* 使用windows的管理工具中的服务管理,将“CYGWIN sshd”服务启动。

* 回到cygwin环境,运行 ssh localhost命令。

在第一步询问中输入yes。在第二步要求输入password时,输入用户password。

* 在cygwin中输入ssh-keygen。一路回车就可以。

* 然后在cygwin下依次运行例如以下命令:

cd ~/.ssh

cp id_rsa.pub authorized_keys

完毕后一路exit退出cygwin环境,再打开cygwin环境,运行ssh localhost。发现例如以下图不须要password就可以进入。就代表成功了。

 

至此。我们为hadoop准备的cygwin环境即已搭建完毕,能够说是成功迈出了西行征途的第一步,不算太费劲地在五指山收服了cygwin这个孙猴子,有了它的帮助。后面等待我们的九九八十一难也就不显得那么可怕了。