Entornos de python
Casper cuenta con un espacio de almacenamiento compartido para los usuarios (el directorio $home) que vive en servidores externos de almacenamiento en red accesibles tanto desde el front-end como desde los nodos de cálculo. El acceso se hace mediante una red dedicada de 10 GbE, que garantiza una alta velocidad pese a la concurrencia de usuarios conectados. Para evitar cuellos de botella, es recomendable hacer un uso razonable de la información del $home, evitando grandes cargas de lectura y escrita desde la red de datos.
Python cuenta con un sistema de instalación de librería muy útil, basado en pip, que permite la instalación de cualquier librería sin más que usar el comando:
$ pip install LIBRERÍA
Al hacer esto, la librería se instala en el directorio $home/.local/lib/python, lo que conlleva una carga de lectura y escritura cada vez que se accede a esa ruta desde los nodos de cálculo. Cuando se lanzan múltiples trabajos en paralelo, se produce una petición masiva a la red de datos, que en casos de librerías pesadas puede sobrecargar la conectividad. Por ese motivo, se establecen los siguientes códigos de buenas prácticas:
Librerías ligeras
Para librerías ligeras y de uso específico o puntual (por ejemplo, sisl), es posible instalar directamente en el $home la librería que se requiera. Para ello, es recomendable abrir una sesión interactiva en un nodo, cargar el módulo de python que corresponda, e instalar la librería con pip. Por ejemplo:
[username@casper] $ qsub -I -q alpha -l walltime=01:00:00
[username@c-0-0] $ module load python-gnu12
[username@c-0-0] $ export PYTHONCACHEPREFIX="/state/partition1/$USER/cache/pycache"
[username@c-0-0] $ export PIP_CACHE_DIR="/state/partition1/$USER/cache/pip-cache"
[username@c-0-0] $ pip3 install --user sisl
Estos comandos instalarán la librería en el directorio $home/.local/lib/pythonX.YY, de modo que queda accesible a todos los nodos usando la red de datos. Una vez instalada la librería, desde el job puede utilizarse añadiendo las instrucciones:
module load python-gnu12
export PYTHONCACHEPREFIX="/state/partition1/$USER/cache/pycache"
export PIP_CACHE_DIR="/state/partition1/$USER/cache/pip-cache"
python3 -c "import sisl; print('sisl OK')"
python3 script.py
Librerías pesadas
El procedimiento anterior es útil para librerías que funcionan de forma independiente, sin cargar muchas dependencias y que no constituyan un stack completo como Numpy, Scipy, Sci-kit learn, etc. Si se requiere el uso de librerías pesadas o de stacks de desarrollo (o si se necesita una versión específica de python) desaconsejamos la creación de entornos virtuales específicos o la instalación con pip, ya que suponen una sobrecarga considerable de los procesos de lectura y escritura.
Para estos casos es posible solicitar a los administradores la creación de módulos específicos que se instalen en local en los nodos de trabajo, evitando la sobrecarga de la red.
