Slurm Node unexpectedly rebooted, reboot issued, reboot timeout, slurm计算节点down
Slurm计算节点手动重启后,管理节点会将此计算节点的状态置为DOWN可在Slurm管理节点使用下面的命令,恢复计算节点状态scontrol update NodeName=nodename State=RESUME
·
Slurm计算节点手动重启后,管理节点会将此计算节点的状态置为DOWN
可在Slurm管理节点使用下面的命令,恢复计算节点状态
scontrol update NodeName=nodename State=RESUME
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)