Skip to content
Snippets Groups Projects
Commit ef4ef582 authored by Jannis Klinkenberg's avatar Jannis Klinkenberg
Browse files

small fixes

parent b4102687
No related branches found
No related tags found
No related merge requests found
......@@ -14,7 +14,7 @@
### Load modules or software
############################################################
# TODO: activate your desired virtual environment
# TODO: load/activate your desired modules and virtual environment
############################################################
### Parameters and Settings
......
......@@ -14,7 +14,7 @@
### Load modules or software
############################################################
# TODO: activate your desired virtual environment
# TODO: load/activate your desired modules and virtual environment
############################################################
### Parameters and Settings
......
......@@ -14,7 +14,7 @@
### Load modules or software
############################################################
# TODO: activate your desired virtual environment
# TODO: load/activate your desired modules and virtual environment
############################################################
### Parameters and Settings
......
......@@ -14,7 +14,7 @@
### Load modules or software
############################################################
# TODO: activate your desired virtual environment
# TODO: load/activate your desired modules and virtual environment
############################################################
### Parameters and Settings
......
......@@ -14,7 +14,7 @@
### Load modules or software
############################################################
# load module for PyTorch container
# load module for TensorFlow container
module load TensorFlow/nvcr-24.01-tf2-py3
module list
......@@ -36,11 +36,11 @@ export NCCL_SOCKET_NTHREADS=8 # multi-threading for NCCL communication
### Execution (Model Training)
############################################################
# tensorflow in container often needs a tmp directory
# TensorFlow in container often needs a tmp directory
NEWTMP=$(pwd)/tmp
mkdir -p ${NEWTMP}
# run the python script inside the container
source set_vars.sh
apptainer exec -e --nv -B ${NEWTMP}:/tmp ${TENSORFLOW_IMAGE} \
bash -c "python -W ignore train_model.py"'
bash -c "python -W ignore train_model.py"
......@@ -9,22 +9,12 @@
#SBATCH --ntasks-per-node=2
#SBATCH --cpus-per-task=24
#SBATCH --gres=gpu:2
#SBATCH --account=supp0001
############################################################
### Load modules or software
############################################################
# TODO: activate your desired virtual environment
module purge
module load GCC/11.3.0
module load OpenMPI/4.1.4
module load CMake/3.21.1
module load Python/3.9.6
module load NCCL/2.20.5-CUDA-12.4.0
module load cuDNN/8.9.7.29-CUDA-12.3.0
source /work/jk869269/venvs/tensorflow-2.17_CUDA-12.3/bin/activate
# TODO: load/activate your desired modules and virtual environment
############################################################
### Parameters and Settings
......
......@@ -14,7 +14,7 @@
### Load modules or software
############################################################
# load module for PyTorch container
# load module for TensorFlow container
module load TensorFlow/nvcr-24.01-tf2-py3
module list
......@@ -36,7 +36,7 @@ export NCCL_SOCKET_NTHREADS=8 # multi-threading for NCCL communication
### Execution (Model Training)
############################################################
# tensorflow in container often needs a tmp directory
# TensorFlow in container often needs a tmp directory
NEWTMP=$(pwd)/tmp
mkdir -p ${NEWTMP}
......
......@@ -9,22 +9,12 @@
#SBATCH --ntasks-per-node=2
#SBATCH --cpus-per-task=24
#SBATCH --gres=gpu:2
#SBATCH --account=supp0001
############################################################
### Load modules or software
############################################################
# TODO: activate your desired virtual environment
module purge
module load GCC/11.3.0
module load OpenMPI/4.1.4
module load CMake/3.21.1
module load Python/3.9.6
module load NCCL/2.20.5-CUDA-12.4.0
module load cuDNN/8.9.7.29-CUDA-12.3.0
source /work/jk869269/venvs/tensorflow-2.17_CUDA-12.3/bin/activate
# TODO: load/activate your desired modules and virtual environment
############################################################
### Parameters and Settings
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment