您的当前位置:首页正文

搭建Spark集群(一)——使用VirtualBox建立虚拟机

来源:化拓教育网

环境准备

  • 一台主机(看个人的配置,当然配置越高性能越好,我自己的是i5+16G+1TB 64位 windows7系统)
  • CentOS 7.0安装文件
  • hadoop-2.6.0.tar.gz、scala-2.10.5.tgz、jdk-7u79-linux-x64.rpm、spark-1.3.1-bin-hadoop2.6.tgz
  • VirtualBox、xshell、WinSCP

对应IP地址

虚拟机 IP地址 hostname
160.Master.Hadoop 192.168.1.160 Master
161.Slave1.Hadoop 192.168.1.161 Slave1
162.Slave2.Hadoop 192.168.1.162 Slave2
163.Slave3.Hadoop 192.168.1.163 Slave3

配置虚拟机

为了方便我们管理这些虚拟机,命名的时候,我们可以按照上面列出的虚拟机名字进行命名,这里根据自己喜好。

因为系统是CentOS 7.0,类型我们选择Linux版本根据自己系统选择32位还是64位

设定虚拟机内存大小(可根据自己电脑配置),这里我设定虚拟机的内存大小为1G


虚拟硬盘选择默认的VDI格式即可

给虚拟硬盘分配空间,默认是【动态分配】,选择这个一开始占据物理硬盘的空间较少,随着使用(安装软件等)逐渐增加,直到之后设定的最大值,我这选择【固定大小】,现在硬盘容量都很大,足够使用了,而且【固定大小】运行起来会快点,但在创建虚拟机的时候需要花更多的时间

选择虚拟硬盘文件的保存位置(为了方便,可以把所有的虚拟机都放到同一个磁盘下面,如D盘);设定分配给虚拟机的硬盘大小,这里设定为20G(作为测试,20G足够使用了)

创建后就是等待了,时间取决于你机器的性能

Paste_Image.png

创建完后,可以在VirtualBox左侧的虚拟机列表查看刚才创建的虚拟机,接下来就是系统的安装了,点击工具栏里的【设置】

在【系统】菜单里,把光驱作为第一启动顺序,硬盘作为第二启动

在【存储】菜单里,选中控制器(默认是没有盘片的,需要通过最右边的小光驱图案,选择安装系统的ISO文件)