[ray入门] 在Linux上安装部署Ray集群

[ray入门] 在Linux上安装部署Ray集群,第1张

Ray 是一个高性能分布式计算框架,借助它可以非常容易的构建分布式运算任务。本文将介绍如何在Linux上部署Ray集群:

Ray集群由一个 Head 节点和多个 Worker 节点组成:

为了方便,我们最好利用 Anaconda 构建来一个独立的python运行环境。(当然你也可以直接使用系统内python运行环境,那么你可以跳过此步骤)

为ray准备一个python环境,以python3.8.8示例:

安装完之后,最好重新登录一下,或者执行一下 source ~/.bashrc 使得环境变量生效

安装ray(版本为1.7.0),这里为了加快速度指定了阿里的镜像源:

在 192.168.100.1 上启动Head节点:

正常会看到如下输出:

输出信息包含了2个关键信息,需要别注意:

在 192.168.100.2 上,按照上面的步骤将python和ray安装好,注意它们的版本必须保持一致。

(另外,Worker不是必须的,因为Head节点本身就具有worker角色)

访问dashboard: http://192.168.100.1:8265

无法访问Ray Dashboard的几个原因

如果是REDHAT或者Centos *** 作系统,可以使用Cobbler软件来进行批量安装。

可以使用以下方法部署CObbler

Cobbler是一个开源项目,用来部署和安装系统。Cobbler不仅仅是一个pxe服务器,他还可以管理dns和dhcp。一般数据中心里或者生产环境,是不允许dhcp, 但是pxe需要使用dhcp,所以我们这里根据mac地址来分配IP,这样dhcp就不会影响现有网络了。

1. 首先关闭selinux

sudo sed -i '/SELINUX/s/enforcing/disabled/' /etc/selinux/config

重新启动linux系统

2. 关闭防火墙iptables

sudo chkconfig iptables off

sudo chkconfig ip6tables off

sudo /etc/init.d/iptables stop

sudo /etc/init.d/ip6tables stop

3. 安装 epel 包

sudo yum install http://mirrors.ustc.edu.cn/Fedora/epel/6/x86_64/epel-release-6-8.noarch.rpm

4. 安装 Cobbler 和它需要的第三方工具包

sudo yum install cobbler cobbler-web xinetd pykickstart cman dhcp tftp-server bind

安装完成后需要设置几个服务自动启动

sudo chkconfig httpd on

sudo chkconfig dhcpd on

sudo chkconfig cobblerd on

sudo service httpd start

sudo service cobblerd start

注:此时dhcpd应该启动失败,因为还没有对dhcp做配置。

5. 配置

5.1 修改/etc/xinetd.d/tftp

disable = yes

=>

disable = no

5.2 修改/etc/xinetd.d/rsync

disable = yes

=>

disable = no

5.3 编辑 /etc/cobbler/settings 文件,设置以下各项,其中 192.168.145.102 是当前机器IP。

server: 192.168.145.102

next_server: 192.168.145.102

pxe_just_once: 1

manage_rsync: 1

manage_dhcp: 1

5.4 设置默认 root 用户的秘密

$ sudo openssl passwd -1 -salt 'random-phrase-here' 'Letmein'

然后将结果替换 /etc/cobbler/settings 文件中的

default_password_crypted:

5.5 设置 Cobbler Web访问的密码

sudo htdigest /etc/cobbler/users.digest "Cobbler" cobbler

5.6 编辑 /etc/cobbler/dhcp.template 文件,下面是我改动部分的配置信息

...

subnet 192.168.145.0 netmask 255.255.255.0 {

option routers192.168.145.102

option domain-name-servers 192.168.145.1

option subnet-mask255.255.255.0

#range dynamic-bootp192.168.145.150 192.168.145.200

default-lease-time21600

max-lease-time43200

next-server$next_server

filename "/pxelinux.0"

host test { # 为指定机器指定ip地址

hardware ethernet 08:00:27:2C:30:8C

fixed-address 192.168.145.155

}

}

...

注意:如果在现有网段内已经有DHCP服务器,需要把 range dynamic-bootp 注释掉,否则会有冲突。这个地方需要特别注意,要根据自己的网络情况来设置。

5.7 重启服务

sudo service xinetd restart

sudo service httpd restart

sudo service cobblerd restart

5.8 启动和检测 cobbler

sudo cobbler get-loaders

sudo cobbler check

此时如果有错误,cobbler会提示,可以根据提示来修复。但是对参数的任何修改都需要使用下面的命令来使其生效

sudo cobbler sync

5.9 Web 测试

访问 http://192.168.145.102/cobbler_web

用户名/密码:cobbler/Letmein

6. 导入系统镜像

这里假定使用CentOS-6.6-x86_64来测试

sudo mount -t auto -o loop /home/kongxx/share/os/CentOS-6.6-x86_64-bin-DVD1.iso /mnt

sudo cobbler import --path=/mnt --name=CentOS-6.6 --arch=x86_64

运行这两条命令后,可以使用下面的命令来查看了

$ sudo cobbler distro list

$ sudo cobbler profile list

也可以通过 Web 界面的 Distros 和 Profiles 来查看。

7. 自动安装系统

由于是在家里的虚拟机里做测试,所以没法使用 IPMI 来管理物理机。这里就只测试一下新的虚拟机可以通过PXE来自动安装系统。

使用VirtualBox创建一个虚拟机,网络设置使用和上面同样的桥接模式。但是在 "虚拟机设置->系统 ->启动顺序" 里把网络勾上并上移到第一位,然后启动虚拟机。此时就可以进入 Cobbler 的网络安装界面,选择上面创建的 CentOS-6.6-x86_64 然后就可以自动安装了。装完后,记得把虚拟机启动顺序改回到硬盘启动优先,然后就可以启动新安装的虚拟机了。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/7370959.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-04
下一篇2023-04-04

发表评论

登录后才能评论

评论列表(0条)

    保存