Ubuntu 18.04安装Tensorflow(GPU)
1.Ubuntu安装Python3.6:
首先拉取远程仓库
sudo add-apt-repository ppa:jonathonf/python-3.6
更新源
sudo apt-get update
在线安装
sudo apt-get install python3.6
补充,其实安装python3用一句:sudo apt-get install python3-dev 即可。查看版本:python3 --version
更改默认值,python默认为Python2,现在修改为Python3
sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100 sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150
2.Ubuntu安装nvidia显卡驱动(参考上一篇博客)
查看nvidia显卡驱动版本
nvidia-smi
3.安装对应版本的CUDA
在安装CUDA时一定要注意其与英伟达显卡驱动以及Linux系统和GCC版本的对应关系,如果版本之间不匹配,是安装不成功的。
CUDA与Driver的对应版本 参考链接:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html cuda8.0与Linux系统以及GCC的对应关系 参考链接:https://docs.nvidia.com/cuda/archive/8.0/cuda-installation-guide-linux/index.html cuda9.0与Linux系统以及GCC的对应关系 参考链接:https://docs.nvidia.com/cuda/archive/9.0/cuda-installation-guide-linux/index.html cuda10.0与Linux系统以及GCC的对应关系 参考链接:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html
查看gcc版本:
gcc -v
由于RTX2060显卡驱动在Ubuntu18.04上是418.56版本,所以选择对应的cuda10.1版本安装
cuda官网下载:https://developer.nvidia.com/cuda-toolkit
另附历史版本:https://developer.nvidia.com/cuda-toolkit-archive
CUDA安装命令:
sudo sh cuda_xxx_linux.run
4.安装CUDA对应的CUDNN版本
cudnn官网下载(需要注册):https://developer.nvidia.com/cudnn
另附:https://developer.nvidia.com/rdp/cudnn-archive
下载Ubuntu18.04对应的CUDNN安装包,然后进入CUDNN安装包所在目录,执行以下命令:
sudo dpkg -i runtime包.deb sudo dpkg -i developer包.deb sudo dpkg -i 代码sample包.deb
至此,CUDNN安装完成。
5.安装对应版本的Tensorflow
首先要清楚最新版Tensorflow最多支持到CUDA哪个版本?
https://www.tensorflow.org/install/install_sources#common_installation_problems
安装pip3(针对python3):
sudo apt-get install python3-pip
官方推荐是用Virtualenv安装,不过这里我们仅使用pip进行安装。
sudo pip3 install tensorflow-gpu
我现在这里安装的是tensorflow_gpu-1.13.1。由于CUDA最新版本是10.1,但是目前最新的tensorflow1.13.1还不支持这个版本,所以只能用CUDA10.0。
推荐搭配:CUDA10.0+CUDNN7.5+tensorflow-gpu1.13.1+python3.6.7
卸载cuda和cudnn,重新安装:
sudo apt remove cudnn* sudo apt-get remove cuda* sudo apt-get autoclean 然后在目录切换到/esr/local/下 cd /usr/local/ sudo rm -r cuda-10.1 搞定啦 可以重新安装其他版本啦
设置root用户密码:
sudo passwd root
以下是编辑 profile文件命令:
1.su 然后输入密码 进入root 2.gedit etc/profile 3.编辑保存.
首先确认/etc/profile中的路径包含了cuda10.0的安装路径及相应的库文件
编辑/etc/profile添加:
export PATH=$PATH:/usr/local/cuda-10.0/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64 export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-10.0/lib64
然后
source /etc/profile
使配置文件生效,再次执行。
安装vim: sudo apt-get install vim vim --version 问题报错:ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory 由于服务器TensorFlow经常报这个错误, 步骤1: sudo vim ~/.bashrc 按下i进入编辑 在末位加入: export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64 export PATH=$PATH:/usr/local/cuda-10.0/bin export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0 按下ESC退出编辑,输入:wq命令进行保存。 使之生效 source ~/.bashrc 步骤2: 据说在修改了步骤1就好了。但是每次我步骤1弄完,问题依旧存在。但是只需要步骤2,问题就可以解决。 检查 /usr/local/cuda-10.0/lib64 下是否有 libcublas.so.10.0 如果有,终端输入: sudo ldconfig /usr/local/cuda-10.0/lib64
然后终端输入python
import tensorflow as tf hello = tf.constant('Hello, TensorFlow!') sess = tf.Session() print(sess.run(hello))
进行tensorflow是否安装成功的验证。