python做数据分析-简单库的介绍和运用

一、数据分析能做什么,简单举几个例子:

1、淘宝可以观察用户的购买记录、搜索记录以及人们在社交媒体上发布的内容选择商品推荐

2、股票可以根据相应的数据选择买进卖出

3、今日头条可以将数据分析应用到新闻推送排行算法当中

4、爱奇艺可以为用户提供个性化电影推荐服务

二、python常用库

Numpy

Numpy是Numerical Python的简写,主要可以用来做Python数值计算。它提供了多种数据结构、算法以及大部分涉及Python数值计算所需的接口。

  • 快速、高效的多维数组对象ndarray
  • 基于元素的数组计算以及直接对数组执行数学运算的函数
  • 用于读写硬盘上基于数组的数据集的工具
  • 线性代数运算、傅里叶变换,以及随机数生成
  • 用于将C、C++、Fortran代码集成到python的工具

Pandas

Pandas使我们进行数据分析的一个主要工具。它所包含的数据结构和数据处理工具的设计使得Python中进行数据清洗和分析非常快捷。pandas一般也是和其他数值计算工具一起使用的,支持大部分Numpy语言风格的数组计算。pandas和numpy最大的区别就是pandas是用来处理表格型或者异质性数据的,而Numpy则刚好相反,它更适合处理同质型的数值类数组数据

matpotlib(用于数据的展现)

matplotlib是最流行的用于绘制数据图表的python库。

Scipy

Scipy是科学计算领域针对不同标准问题域的包集合。提供了强大的科学计算方法(矩阵分析、信号分析、数理分析等)

Ipython和Jupyter notebook

IPython是一个加强版的Python解释器,Juypyter notebook是一种基于Web的代码笔记本,最初也是源于IPython项目。

三、环境安装

1、Ipython(一般不用)

安装

  pip3 install ipython

2、jupyter notebook(基于ipython)

两种安装和启动方式:

  a. 命令行安装:

     pip3 install jupyter

    启动:

     jupyter notebook

    缺点:必须手动安装数据分析包

  b. anaconda:软件(强大软件)

     有点:包含数据分析的基础包 大概200个左右的科学运算

jupyter notebook 快捷键:

  1.运行当前代码并选中下一个单元格 shift + enter

  2.运行当前的单元格 crtl +enter

  3.  绿色:编辑模式

     蓝色:命令行模式

  3.1在单元格的上方添加一个单元格,按esc进入命令行模式,按a(above)添加

  3.2在单元格的上方添加一个单元格,按esc进入命令行模式,按b(below)添加

  4.删除一个单元格,按esc进入命令行模式,按dd(delete)删除

  5.代码和markdown的切换,按esc进入命令行模式,按m切换

相关推荐