Skip to content

快速开始

这里我们展示了在集群上安装gRASPA的方法,例如在Quest @ NorthwesternPermutter @ LBNL上的安装方法

详细的本地机器(例如 Ubuntu 24.04)的安装过程在这里

🤖 安装

  • 📝 NOTE: 如果你不需要深度潜能,cd src_clean/,从第 6 步开始。

  • 📝 NOTE: 检查 GPU 的计算能力(cc),它与 GPU 的架构有关。

    你需要这个来正确编译代码! 以下是一些流行显卡的 cc:

    • Tesla A100: cc80
    • RTX 30 系列: cc86
    • RTX 40 系列: cc89
    • 📝 在编译脚本中使用 -target=gpu 作为简单选项

🎤 第一步

我们将 TensorFlow2 C++ API 下载到本地目录:(假设在 HOME 目录中)

mkdir ctensorflow
cd ctensorflow
wget https://storage.googleapis.com/tensorflow/libtensorflow/libtensorflow-gpu-linux-x86_64-2.11.0.tar.gz
tar -xvf libtensorflow-gpu-linux-x86_64-2.11.0.tar.gz
cd ..
vi .bashrc

💃 第二步

将以下目录添加到 .bashrc 文件中的环境变量中:

export LIBRARY_PATH=$LIBRARY_PATH:~/ctensorflow/lib
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/ctensorflow/lib

🎸 第三步

然后,我们安装 CppFlow:

git clone https://github.com/serizba/cppflow
cd cppflow
mkdir build
cd build
cmake -DCMAKE_PREFIX_PATH=~/ctensorflow/ ..
make install DESTDIR=~/ctensorflow/

🏀 第四步

NERSC 有自己的 PyTorch/LibTorch 模块,在Quest和其他本地机器上,我们推荐 libtorch-2.0.1-cu117,请检查 PyTorch 的 pytorch.org

现在我们可以开始给 gRASPA 代码打补丁,以添加机器学习势功能。 例如,如果我们想使用基于 LibTorch 的 Allegro 模型:

mkdir patch_Allegro

🎶 第五步

修改 patch.py 文件中的第 64 行为 patch_model=['Allegro']。 然后,

python patch.py
现在打过补丁的源码在 patch_Allegro/ 文件夹中。进入打过补丁的文件夹,我们还有一些最后的工作要做。

cd patch_Allegro/

🐔 第六步

最后,由于 NERSC 的配置,我们需要修改源码:

sed -i "s/std::filesystem/std::experimental::filesystem/g" *
sed -i "s/<filesystem>/<experimental\/filesystem>/g" *

🦋 第七步

然后,将 NVC_COMPILE_NERSC 复制到源码文件夹中,并按如下方式编译代码:

注意: 如果你使用原版,只需将 NVC_COMPILE_NERSC 替换为 NVC_COMPILE_NERSC_VANILLA 并继续。

chmod +x NVC_COMPILE_NERSC
./NVC_COMPILE_NERSC
如果你在不同目录中安装了 CppFlow 和 TensorFlow API,请记得更改 NVC_COMPILE_NERSC 中的 cppflowDirtfDir 目录。 编译过程中可能会看到一些警告信息,请忽略它们。一旦准备就绪,你将在文件夹中看到一个二进制可执行文件 nvc_main.x

Hooray!!!

GG~ 干得好!现在你可以开始了!