使用已部署软件提交作业
为方便使用,集群通过modules工具统一管理环境变量,可以在E-Shell中使用module相关命令查看、设置与调用所需要的软件环境等。下面为大家介绍如何使用modules工具加载已经部署的软件。
module常见命令
命令 | 含义 | 举例 |
---|---|---|
module avail | 查看中心部署的所有环境 | module avail |
module load modulefile | 加载名为modulefile的环境 | module load compiler/devtoolset/7.3.1 |
module list | 列出当前加载的环境 | module list |
module unload modulefile | 不加载名为modulefile的环境 | module unload compiler/devtoolset/7.3.1 |
module show modulefile | 查看modulefile的具体信息 | module show compiler/devtoolset/7.3.1 |
module purge | 清理当前加载的所有环境 | module purge |
注意:
(1) module 命令可搭配作业提交脚本使用,把需要加载的环境直接写到作业脚本中去,避免环境冲突;
(2) module 其他参数可使用module -H/--help 查看
以集群部署的abinit为例提交作业
1、点击首页的“命令行[ESHELL]”,进入命令行终端。
2、使用作业脚本提交一个2节点(-N 2)、每个节点32核(--ntasks-per-node=32)、在 kshctest 队列上运行的作业,脚本名称可设为abinit.slurm,
编辑脚本:vi abinit.slurm ,然后写入以下脚本内容:
#!/bin/bash
#SBATCH -J abinit
#SBATCH -p kshctest
#SBATCH -N 2
#SBATCH --ntasks-per-node=32
module purge
module load compiler/intel/2017.5.239 mpi/hpcx/2.4.1/intel-2017.5.239
module load apps/abinit/8.10.3/hpcx-2.4.1-intel2017
srun --mpi=pmix_v3 abinit < example.in
参数 | 含义 |
---|---|
-J abinit | 指定作业名为abinit |
-p kshctest | 指定使用队列为kshctest |
-N 2 | 申请两个计算节点 |
--ntasks-per-node=32 | 每个节点使用32核 |
module purge | 清理当前环境,避免环境冲突 |
module load compiler/intel/2017.5.239 | 加载使用的软件以及编译软件使用的环境 |
mpi/hpcx/2.4.1/intel-2017.5.239 | 同上 |
module load apps/abinit/8.10.3/hpcx-2.4.1-intel2017 | 同上 |
srun abinit < example.in | 并行运行命令 |
--mpi=pmix_v3 | hpcx的通信初始化参数 |
abinit | 软件执行程序的名字 |
example.in | 需要计算的输入文件(算例)名字 |
注意:
(1) -J、-p、-N、--ntasks-per-node=32 为slurm调度参数,更多调度命令可使用sbatch --help 命令查看;
(2) slurm 脚本中的命令依次执行,提交作业时需把脚本和输入文件放在相同文件夹,并在该文件夹下提交作业;
(3) 该示例以昆山中心为准,其他中心资源请根据实际对应修改队列、核数和软件环境等;
(4) 上述演示为命令行提交作业方式,除此之外还有模板提交和图形提交两种方式(需软件自身支持),具体见“其他作业提交方式”;
(5) 以上为开源部署软件使用方法,常用商业软件(如 VASP、Material Studio、Gaussian)均可正常在计算服务平台上使用,若使用这类商业软件,需提前购买版权以获取使用许可,上传安装包后可在微信群内联系工程师协助完成软件的安装和测试。
查看作业运行情况及参数详细介绍请点击查看SLURM命令。
使用未部署软件提交作业
平台没有部署的软件需要您根据“文件传输与下载”中介绍的方法上传安装包到您的账号下,截图上传路径发给用户群的工程师,工程师会帮您安装并按照您的需求配置,配置完成以后告知您使用方法。