快速开始
这里我们展示了在集群上安装gRASPA的方法,例如在Quest @ Northwestern和Permutter @ LBNL上的安装方法
详细的本地机器(例如 Ubuntu 24.04)的安装过程在这里
安装
-
NOTE: 如果你不需要深度潜能,cd src_clean/,从第 6 步开始。
-
NOTE: 检查 GPU 的计算能力(cc),它与 GPU 的架构有关。
你需要这个来正确编译代码! 以下是一些流行显卡的 cc:
- Tesla A100: cc80
- RTX 30 系列: cc86
- RTX 40 系列: cc89
在编译脚本中使用
-target=gpu
作为简单选项
第一步
我们将 TensorFlow2 C++ API 下载到本地目录:(假设在 HOME 目录中)
mkdir ctensorflow
cd ctensorflow
wget https://storage.googleapis.com/tensorflow/libtensorflow/libtensorflow-gpu-linux-x86_64-2.11.0.tar.gz
tar -xvf libtensorflow-gpu-linux-x86_64-2.11.0.tar.gz
cd ..
vi .bashrc
第二步
将以下目录添加到 .bashrc
文件中的环境变量中:
export LIBRARY_PATH=$LIBRARY_PATH:~/ctensorflow/lib
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/ctensorflow/lib
第三步
然后,我们安装 CppFlow:
git clone https://github.com/serizba/cppflow
cd cppflow
mkdir build
cd build
cmake -DCMAKE_PREFIX_PATH=~/ctensorflow/ ..
make install DESTDIR=~/ctensorflow/
第四步
NERSC 有自己的 PyTorch/LibTorch 模块,在Quest和其他本地机器上,我们推荐 libtorch-2.0.1-cu117
,请检查 PyTorch 的 pytorch.org
现在我们可以开始给 gRASPA 代码打补丁,以添加机器学习势功能。 例如,如果我们想使用基于 LibTorch 的 Allegro 模型:
mkdir patch_Allegro
第五步
修改 patch.py
文件中的第 64 行为 patch_model=['Allegro']
。
然后,
python patch.py
patch_Allegro/
文件夹中。进入打过补丁的文件夹,我们还有一些最后的工作要做。
cd patch_Allegro/
第六步
最后,由于 NERSC 的配置,我们需要修改源码:
sed -i "s/std::filesystem/std::experimental::filesystem/g" *
sed -i "s/<filesystem>/<experimental\/filesystem>/g" *
第七步
然后,将 NVC_COMPILE_NERSC
复制到源码文件夹中,并按如下方式编译代码:
注意: 如果你使用原版,只需将 NVC_COMPILE_NERSC
替换为 NVC_COMPILE_NERSC_VANILLA
并继续。
chmod +x NVC_COMPILE_NERSC
./NVC_COMPILE_NERSC
NVC_COMPILE_NERSC
中的 cppflowDir
和 tfDir
目录。
编译过程中可能会看到一些警告信息,请忽略它们。一旦准备就绪,你将在文件夹中看到一个二进制可执行文件 nvc_main.x
。
GG~ 干得好!现在你可以开始了!