Skip to main content

Slurm Exit Codes

Overview

Slurm jobs report an exit code from the output of scontrol show job XXXXX.

The most basic output is:

  • 0 → operating succeeded without error
  • non-zero value → some error occurred

Table

Here is a more detailed breakdown of exit codes:

Exit CodeDescription
1General failure
2Incorrect use of shell builtins
3-124Some error in job (check software exit codes)
125Out of memory
126Command cannot execute
127Command not found
128Invalid argument to exit

Exit Codes Greater than 128

  • Exit codes 129-192 indicate jobs terminated by Linux signals
    • For these, subtract 128 from the number and match to signal code
    • Enter kill -l to list signal codes
    • Enter man signal for more information

For quick reference, here is a list of all the possible signals:

$ kill -l
1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP
21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ
26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR
31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3
38) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8
43) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
63) SIGRTMAX-1 64) SIGRTMAX

For example, if a job exits with code 137:

[software@login02:slurm]$ echo "137-128" | bc
9
### 9 => SIGKILL