显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?

https://www.cnblogs.com/marsggbo/p/11838823.html

conda 换源

  • 查看原来的镜像源
    1
    conda config --show
  • 删除旧镜像源
    1
    conda config --remove channels <https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/cpu/>  
  • 添加新镜像源
    1
    conda config --add channels <https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/cpu/>
  • 设置搜索时显示通道地址
    1
    conda config --set show_channel_urls yes

  • 查看已有的channel
    1
    conda config --show channels
  • 添加新的channel
    1
    2
    3
    4
    5
    conda config --add channels <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/>  
    conda config --add channels <https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge>
    conda config --add channels <https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/>
    conda config --add channels <https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/>
    conda config --set show_channel_urls yes

pip 换源

pip国内常用源:

阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/

例子

1
pip install -i <https://pypi.tuna.tsinghua.edu.cn/simple> keras

Pytorch 换卡运行

换卡运行

1
CUDA_VISIBLE_DEVICES=1 python example.py xxxxxx

cuda&cudnn版本查看

cuda版本

1
nvcc -V or cat /usr/local/cuda/version.txt

cudnn版本

1
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

Ubuntu 安装cuda

  1. 下载cuda
    在官网选择自己需要的cuda版本
    https://developer.nvidia.com/cuda-toolkit-archive
    并根据系统和环境选择下载方式

  2. 安装cuda
    执行命令

    1
    sudo sh cuda_xx.x.xxx_xxx.xx_linux.run

    比较新的版本在安装之前提示选择安装的内容,这里把驱动Driver的选择取消,即不选择安装驱动Driver
    然后一路闪电带火花

  3. 设置cuda环境变量
    打开.bashrc

    1
    sudo gedit ~/.bashrc

    添加如下内容

    1
    2
    3
    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-xx.x/lib64
    export PATH=$PATH:/usr/local/cuda-xx.x/bin
    export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-xx.x
  4. 验证
    在终端输入

    1
    nvcc --version

    显示正确版本则安装成功

Ubuntu 安装cudnn

下载链接
https://developer.nvidia.com/zh-cn/cudnn
选择合适的版本下载(tgz format(library),deb format(runtime,develop))
下载好后直接命令行解压,然后复制 lib64 和 include 文件夹到 /usr/local/cuda-xx.x,命令如下:

1
2
3
4
tar -zxvf cudnn-xx.x-linux-x64-v7.5.0.56.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-xx.x/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-xx.x/lib64
sudo chmod a+r /usr/local/cuda-xx.x/include/cudnn.h /usr/local/cuda-xx.x/lib64/libcudnn*

Ubuntu cuda 版本切换

  1. 设置链接库
    执行sudo gedit ~/.bashrc 打开.bashrc,可以看到已经安装的版本,比如
    1
    2
    3
    export PATH="$PATH:/usr/local/cuda-9.0/bin"
    export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64/"
    export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda-9.0/lib64"
    将上面行中所有的cuda-9.0更改为cuda:
    1
    2
    3
    export PATH="$PATH:/usr/local/cuda/bin"
    export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64/"
    export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda/lib64"
    保存退出后,在终端运行如下命令使之生效:
    1
    source ~/.bashrc
  2. 切换版本
    1
    2
    sudo rm -rf /usr/local/cuda #删除之前创建的软链接
    sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda #创建新 cuda-10.0 的软链接

Ubuntu 安装TensorRT

使用压缩包进行安装

  1. 下载TensorRT的压缩包
    下载地址 https://developer.nvidia.com/nvidia-tensorrt-download
    需要填写问卷之后才能下载
  2. 解压并添加环境变量
    1
    tar xzvf TensorRT-x.××××.tar
    添加环境变量需要注意TensorRT的版本需要和cuda以及cudnn一致
    1
    2
    3
    4
    5
    sudo gedit ~/.bashrc
    export LD_LIBRARY_PATH=/home/wsy/TensorRT-5.0.2.6/lib:$LD_LIBRARY_PATH
    export CUDA_INSTALL_DIR=/usr/local/cuda-x.x
    export CUDNN_INSTALL_DIR=/usr/local/cuda-x.x
    source ~/.bashrc
  3. 安装
    cd到解压目录,并且进入需要安装的conda环境,安装所有whl文件
    1
    2
    3
    4
    5
    #先进入conda虚拟环境
    conda activate env_name
    #install TensorRT
    cd $HOME/tensorrt-x.x.x.x/python
    pip install xxxxxx.whl
  4. 测试
    测试TensorRT是否安装成功,进入Python编辑器导入tensorrt和uff模块
    1
    2
    3
    4
    import tensorrt
    import uff
    print(tensorrt.__version__)
    print(uff.__version__)
    此处print(uff.__version__)可能会报错是因为没有安装TensorFlow的原因,可不用管。至此TensorRT安装完成。

pytorch环境更新包

-U更新到最新版本,加上==指定版本

1
pip install -U tensorflow-gpu==2.4.1