Система управления заданиями на вычислительных кластерах

Запуск программ из стандартных пакетов

Запуск через диспетчерскую систему программ из стандартных пакетов, таких как ANSYS имеет свою специфику. Дело в том, что они имеет собственный механизм запуска, управляемый через командную строку. Поэтому для них нет другого способа, как писать специальные запускающие скрипты, которые «на лету» формируют запускающий скрипт для команды qsub, внутри которого будет сформирована правильная команда запуска программы. Такие скрипты написаны для запуска программ ANSYS и cfx5solve.

Для запуска программы ansys110 следует использовать команду:

<qansys JOB QUE NODES CORES Tlimit. Здесь

JOB — имя основного файла данных без расширения (подразумевается, что он имеет расширение .dat);

QUE — имя очереди (по умолчанию TP),

NODES — количество узлов (по умолчанию 1),

CORES — количество ядер на каждом узле (по умолчанию 1),

Tlimit — требуемое для задания время (по умолчанию 336 часов).

Параметры позиционные, поэтому начиная с некоторого все остальные могут быть пропущены.

Замечание: программа ANSYS требует указания лицензии в командной строке. На сегодняшний день для нее есть два типа лицензий:

  1. Academic Research (aa_r), их 5 штук, но они позволяют работать не более чем с двумя процессами,хоть на одном узле, хоть на двух.
  2. Multiphysics (ane3fl) не имеет ограничений по количеству процессов, но она одна единственная. Под этой лицензией может выполняться одновременно только одно задание.

Поэтому, если произведение NODES*CORES <= 2, то задействуется лицензия aa_r, в противном случае ane3fl. Задание формируется и отправляется на счет, но если оказывается, что лицензия занята, то оно вылетает по ошибке.

Аналогичный синтаксис имеет команда для запуска программы cfx5solve

qcfx JOB QUE NODES CORES Tlimit. Здесь

JOB — имя основнoго (definition) файла данных без расширения (подразумевается, что он имеет расширение .def);

QUE — имя очереди (по умолчанию TP),

NODES — количество узлов (по умолчанию 1),

CORES — количество ядер на каждом узле (по умолчанию 1),

Tlimit — требуемое для задания время (по умолчанию 336 часов).

Для этой команды с жесткими лицензионными ограничениями не сталкивались.

Обе команды должны запускаться из каталога, содержащего файлы данных.

Кроме этого, написано множество команд для запуска других стандартных пакетов.

Квантово-химические пакеты

Gaussian03:

qgauss JOB QUE NODES CORES TLim
JOB - имя com-файла без расширения
QUE - IBMX | TP | WSD
NODES — число узлов (по умолчанию 1)
CORES — число ядер на узле (по умолчанию 1)
TLim - лимит времени (по умолчанию 335 часов)

GAMESS:

qgamess JOB QUE NODES TLim Mail
JOB - имя inp-файла без расширения
QUE - IBMX | TP | WSD
NODES - число узлов (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов)
Mail - почтовый адрес (default $USER)

ORCA:

qorca3 JOB QUE NCPUS TLim
JOB - имя файла с заданием
QUE - IBMX | TP | WSD
NCPUS - число узлов (по умолчанию 1 )
TLim - лимит времени ( по умолчанию 336 часов)

OPENMX:

qopenmx JOB QUE NODES CORES TLim
JOB - имя dat-файла без расширения
QUE - IBMX | TP | WSD
NODES - число узлов (по умолчанию 1)
CORES - число ядер на узле (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов)

Firefly (PC-GAMESS):

qfirefly JOB QUE NODES TLim Mail
JOB - имя inp-файла без расширения
QUE - IBMX | TP | WSD
NODES - число узлов (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов)
Mail - почтовый адрес (по умолчанию $USER)

Квантово-физические пакеты

FDMNES:

qfdm16 JOB QUE NCPUS TLim Mail
JOB - имя задания (произвольное)
QUE - IBMX | TP | WSD
NCPUS - число узлов (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов)
Mail - почтовый адрес (по умолчанию $USER)

FEFF84:

qfeff JOB QUE TLim Mail
JOB - имя задания (произвольное)
QUE - IBMX | TP | WSD
TLim - лимит времени (по умолчанию 336 часов)
Mail - почтовый адрес (по умолчанию $USER)

SPRKKR:

qkkr JOB QUE NCPUS TLim
JOB - имя inp-файла без расширения
QUE - IBMX | TP | WSD
NCPUS - число узлов (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов)

VASP:

qvasp5 JOB QUE NCPUS TLim Mail
JOB - имя задания (произвольное)
QUE - IBMX | TP | WSD
NCPUS - число узлов (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов) Mail - почтовый адрес ( по умолчанию $USERS)

IBINIT:

qabinit EXE JOB QUE NODES TLim Mail
EXE - имя программы для выполнения (default abinit)
JOB - имя входного файла без расширения
QUE - queue for execution: IBMX | TP | WSD
NCPUS - число узлов (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов) Mail - почтовый адрес ( по умолчанию $USERS)

QUANTUM ESPRESSO:

qesp EXE JOB QUE NODES TLim Mail
EXE - имя программы для выполнения (default pw.x)
JOB - имя входного файла без расширения
QUE - queue for execution: IBMX | TP | WSD
NODES - число узлов (по умолчанию 1)
NCORE - число процессов на узле (по умолчанию 1)
NB - number of band group
NT - number of task group
ND - number of processors for linear algebra
TLim - лимит времени (по умолчанию 336 часов) Mail - почтовый адрес ( по умолчанию $USERS)

YAMBO:

qyambo EXE JOB QUE NODES NCORE TLim Mail
EXE - имя программы для выполнения (default yambo)
JOB - имя задания (произвольное)
QUE - queue for execution: IBMX | TP | WSD
NODES - число узлов (по умолчанию 1)
CORES - число ядер в процессоре (по умолчанию 1)
TLim - лимит времени (по умолчанию 336 часов) Mail - почтовый адрес ( по умолчанию $USERS)
С вопросами по работе с диспетчерской системой и со стандартными пакетами прикладных программ обращаться по телефону: +7(863)219-97-13
E-mail: dvn@sfedu.ru.

Назад