机器学习开篇第一步:如何设置Python环境?
为机器学习设置Python环境可能是一项棘手的任务。如果您以前从未设置过类似的东西,那么您可能需要花费数小时来处理不同的命令,才能让它正常工作。但我们只是想要直接得到ML!
在本教程中,您将学习如何设置稳定的Python机器学习开发环境,您将能够直接进入ML,并且也不用再担心安装包的事情。
(1)设置Python 3和Pip
第一步是安装pip,一个Python包管理器:
sudo apt-get install python3-pip
使用pip,我们将能够通过简单的pip install your_package安装Python包索引中索引的任何Python包。您很快就会看到我们如何使用它来设置我们的虚拟环境。
接下来,我们将从命令行运行pip或python命令时将Python 3设置为默认值。这使得使用Python 3更容易、更方便。如果我们不这样做,那么如果我们想使用Python 3,我们必须记住每次都输入pip3和python3!
为了强制Python 3成为默认值,我们将修改〜/ .bashrc文件。从命令行,执行以下命令以查看该文件:
nano~ / .bashrc
向下滚动到#some more ls aliases部分并添加以下行:
别名python ='python3'
保存文件并重新加载更改:
source~ / .bashrc
Python 3现在是你的默认Python!您可以在命令行上使用简单的python your_program运行它。
(2)创建虚拟环境
现在我们将建立一个虚拟环境。在那里,我们将安装机器学习所需的所有python包。
我们使用虚拟环境来分离我们的编码设置。想象一下,如果在某些时候你想在你的计算机上做两个不同的项目,这需要不同版本的库。将它们全部放在相同的工作环境中可能会很麻烦,您可能会遇到库版本冲突的问题。项目1的ML代码需要numpy的1.0版本,但是项目2需要1.15版本。
虚拟环境允许我们隔离我们的工作区域以避免这些冲突。
首先,安装相关的包:
sudo pip install virtualenv virtualenvwrapper
一旦我们安装了virtualenv和virtualenvwrapper,我们将再次需要编辑〜/ .bashrc文件。将这3行放在底部并保存。
export WORKON_HOME = $ HOME / .virtualenvs export VIRTUALENVWRAPPER_PYTHON = / usr / bin / python3 source/usr/local/bin/virtualenvwrapper.sh
保存文件并重新加载更改:
source~ / .bashrc
现在我们可以最终创建虚拟环境:
mkvirtualenv ml
我们刚刚创建了一个名为ml的虚拟环境。要输入它,请执行以下操作:
workon ml
太好了!您在ml virtualenv中执行的任何库安装都将在那里被隔离,并且不会与任何其他环境冲突!因此,每当您希望运行依赖于mlenvironment中安装的库的代码时,请先使用workon命令进入,然后正常运行代码。
如果您需要退出virtualenv,请运行以下命令:
deactivate
(3)安装机器学习库
现在我们可以安装自己的ML库了!我们将使用最常用的:
- numpy:用于任何矩阵的工作,特别是数学运算
- scipy:科学和技术计算
- pandas:数据处理、操作和分析
- matplotlib:数据可视化
- scikit learn:机器学习
这是一个简单的技巧,可以快速安装所有这些库!创建一个requirements.txt文件并列出您要安装的所有软件包,如下所示:
numpy SciPy pandas matplotlib scikit learn
完成后,只需执行以下命令:
pip install -r requirements.txt
瞧! Pip将继续并一次性安装文件中列出的所有软件包。
恭喜,您的环境已经建立,您已经可以进行机器学习了!
编译出品