python数据分析010_seaborn的绘图方式

滚滚熊的学习笔记

2020-06-01

一.单变量分析绘图

1.什么是单变量分析？

　　单变量其实就是我们通常接触到的数据集中的一列数据　　

2.使用NumPy模块从标准正态分布中随机地抽取1000个数，作为我们的连续数值型数据。

　　data = np.random.normal(size=1000) random是NumPy的一个随机模块，在random模块中的normal方法表示从正态分布中随机产生size个数值。

3.在seaborn里最常用的观察单变量分布的函数是distplot()，默认地，这个函数会绘制一个直方图，并拟合一个核密度估计。

　　sns.distplot(data, bins, hist = True, kde = True)

　　data参数记录绘图所用的数据，而bins参数在绘制直方图时可以进行设置，用于设置分组的个数，默认值时，会根据数据的情况自动分为n个组，若是想指定分组的个数，可以设置该参数，然后计算我们可以增加其数量，来看到更为详细的信息。

　　hist和kde参数用于调节是否显示直方图及核密度估计图，默认hist、kde均为True，表示两者都显示。我们可以通过修改参数为False选择是否将其中之一去掉。

import numpy as np
import seaborn as sns
# 从标准正态分布中随机地抽取1000个数
data = np.random.normal(size=1000)
sns.set(style=‘darkgrid‘)
sns.distplot(data,10,kde=True, hist=True)

4.使用sns.kdeplot()函数绘制数据的概率密度曲线图。

　　sns.kdeplot(data1, data2, shade = False)

　　shade参数用于设置图像下方的部分是否设置阴影，默认值为False，表示不绘制阴影。

import numpy as np
import seaborn as sns
data = np.random.normal(size=1000)
sns.set(style=‘darkgrid‘)
sns.kdeplot(data, shade = True)

二.绘制双变量联合分布图

1.在Seaborn中绘制连续数值型双变量我们使用sns.jointplot():

　　seaborn.jointplot(x, y, data=None, kind=‘scatter‘)

　　x、y：分别记录x轴和y轴的数据名称。

　　data：数据集，data的数据类型为DataFrame。

　　　　kind：用于设置图像的类型，可选的类型有：‘scatter‘ | ‘reg‘ | ‘resid‘ | ‘kde‘ | ‘hex‘，分别表示散点图、回归图、残差图、核密度图和蜂巢图。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 创建dataframe: df
df = pd.DataFrame({‘x‘: np.random.normal(size=500),
‘y‘: np.random.normal(size=500)})
# 绘制双变量散点图
sns.jointplot(x=‘x‘, y=‘y‘, data=df,kind=‘reg‘)
plt.show()

三.多变量关系分布图

1.使用seaborn中的pairplot()方法，就可以绘制连续数值型多变量关系分布图

　　sns.pairplot( data, hue, vars, kind, diag_kind)

参数介绍

data表示绘图所用到的数据集
hue参数表示按照某个字段进行分类
vars参数可以用于筛选绘制图像的变量，用列表的形式传入列名称
kind参数用于设置变量间图像的类型，可以选择‘scatter‘散点图，或者 ‘reg‘回归图
diag_kind用于设置对角线上的图像类型，可以选择‘hist‘直方图，或者‘kde‘核密度图

代码:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv(‘/data/course_data/data_analysis/iris.csv‘)
# 双变量图像设置为回归图，单变量（对角线图）设置为核密度图
sns.pairplot(data, hue=‘species‘,vars=[‘sepal_length‘, ‘sepal_width‘],kind=‘reg‘, diag_kind=‘kde‘)
plt.show()

四.总结

python数据分析010_seaborn的绘图方式

seaborn data python 变量

滚滚熊的学习笔记

0 关注 0 粉丝 0 动态

相关推荐

Python数据可视化，seaborn如何做出非常规图表

上一节我们只是单纯使用 matplotlib 制作出以下图表：。最常见的就是使用 seaborn ，他是基于 matplotlib 的包装。这一节我们就来看看，如何使用 seaborn 生成标准图表，然后结合 matplotlib 做出定制效果。特别是多系

comtop0 2020-10-31

8个流行的Python可视化工具包，你喜欢哪个？

喜欢用 Python 做项目的小伙伴不免会遇到这种情况：做图表时，用哪种好看又实用的可视化工具包呢？之前文章里出现过漂亮的图表时，也总有读者在后台留言问该图表时用什么工具做的。下面，作者介绍了八种在 Python 中实现的可视化工具包，其中有些包还能用在其

alili 2020-09-08

Python数据分析实战，小费数据集应用

本节选用的是Python的第三方库seaborn自带的数据集，该小费数据集为餐饮行业收集的数据，其中total_bill为消费总金额、tip为小费金额、sex为顾客性别、smoker为顾客是否吸烟、day为消费的星期、time为聚餐的时间段、size为聚餐

BMUranus 2020-08-16

Python数据分析实战项目介绍

Python 语言是数据分析领域最常用的编程语言，因此本文将向大家介绍一个Python数据分析实战项目，学完这个项目大家可以使用 Pandas 进行数据准备、清洗、整理、计算与可视化，以及掌握最主流的数据可视化框架Seaborn和Echarts，并利用Bo

Cocainebai 2020-08-15

深度讲解Python四大常用绘图库的“绘图原理”

最近有不少粉丝来问我，Python绘图库太多，我知不知道学哪一个?即使我选择了某一个绘图库后，我也不知道怎么学，我不知道第一步做什么，也不知道接下来该怎么做，四个字一学就忘。其实这也是我当时很困扰的一个问题，我当时在学习完numpy和pandas后，就开始

wordmhg 2020-07-28

2020年您应该知道的13个优秀Python库

在本文中，我们介绍了2020年很有用的Python库，用于数据处理，数据可视化，数据库，部署和数据建模领域。它是Python中数据分析和数据处理的很受欢迎选择之一。如果您打算从事数据科学家或数据分析师的职业并使用Python，那么此非常重要的工具值得学习。

huang00 2020-07-13

数据可视化（基于matplotlib、seaborn库）

#b蓝色，--虚线，-实线，.点线，.-点划线，+加号线，等等，线型可随意组合，linewidth线宽。plt.style.use#设置画布大小 plt.figure #scatter绘制散点图，s设置点大小 plt.scatter. 我们来看看seabo

Tonybo 2020-04-27

Python数据可视化—seaborn简介和实例

Seaborn其实是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn就能做出很具有吸引力的图。这里实例采用的数据集都是seaborn提供的几个经典数据集，dataset文件可见于Github。本

oXiaoChong 2020-02-01

测验9: Python计算生态纵览 (第9周)-单选题

解析：aip是baidu的人工智能功能Python访问接口。

文山羊 2019-12-06

Python可视化 | Seaborn包—kdeplot和distplot

核密度估计是在概率论中用来估计未知的密度函数，属于非参数检验方法之一。通过核密度估计图可以比较直观的看出数据样本本身的分布特征。sns.kdeplot #cut：参数表示绘制的时候，切除带宽往数轴极限数值的多少。sns.kdeplot#vertical：表

柠檬班 2019-12-05

使用MongoDB、Seaborn和Matplotlib分析API数据

介绍软件开发职位通常要求的技能是使用NoSQL数据库的经验。本教程将探索如何使用API收集数据，将数据存储在MongoDB数据库中，并对数据进行一些分析。但是，在进入代码之前，让我们花点时间来复习一下MongoDB和API，以确保我们能理解我们是如何处理收

xinxuwang 2019-10-26

官方调研重磅发布，Pandas或将重构？

为指引 Pandas 未来开发方向，Pandas 官方团队于 2019 年夏搞了一次调研，这次调研历时 15 天，共有 1250 条反馈数据。问卷数据保存在 data 文件夹的 2019.csv.zip 文件里。这里又学一招，原来 pandas 可以直接从

wangquannuaa 2019-10-24

分享8个非常流行的 Python 可视化工具包

喜欢用 Python 做项目的小伙伴不免会遇到这种情况：做图表时，用哪种好看又实用的可视化工具包呢？之前文章里出现过漂亮的图表时，也总有读者在后台留言问该图表时用什么工具做的。下面，作者介绍了八种在 Python 中实现的可视化工具包，其中有些包还能用在其

python0 2019-06-05

机器学习数据绘制：一个非常优秀的python可视化库seaborn绘图工具

推荐正文前面分享了matplotlib画图，而seaborn是在matplotlib基础之上进行画图的，它将matplotlib进行了封装，是的画图更加的简单。%matplotlib inline是jupyter notebook里的命令, 意思是将那些用

NeverStop 2019-07-01

代码详解：用Python清理、分析和可视化调查数据

全文共3672字，预计学习时长30分钟或更长如何利用panda、matplotlib和seaborn来分析脏数据，并且从中有所领悟呢？通过本文，你一定会有所了解。调查猴子是最受欢迎的数据调查平台之一。本文将展示一些你可能想要询问的关于调查数据的问题示例，以

猫咪不爱吃鱼鱼 2019-07-01

Python数据分析：seaborn

seaborn是python中的一个非常强大的数据可视化库，它集成了matplotlib，下图为seaborn的官网，如果遇到疑惑的地方可以到官网查看。import seaborn as sns2.sns.set_style()：不传入参数用的就是seab

mingrixing 2019-06-30

Python数据可视化的四种简易方法

数据可视化是任何数据科学或机器学习项目的一个重要组成部分。在项目结束的时候，能够以清晰的、简洁的和令人信服的方式呈现最终结果，这是非常重要的，让你的用户能够理解和明白。不同的颜色代表不同的级别，矩阵指数将两个对比的列或特征连接在一起。

paopao00 2019-06-29

数据可视化Seaborn从零开始学习教程（三）数据分布可视化篇

数据识别网格绘图本次将主要介绍数据集的分布可视化的使用。这会让我们对数据特征有个很好的初始认识，同时也会影响后续数据分析以及特征工程的方法。本篇将会介绍如何使用 seaborn 的一些工具来检测单变量和双变量分布情况。首先还是先导入需要的模块和数据集。我们

数据中心运维管理 2019-06-27

数据可视化Seaborn从零开始学习教程（二）颜色调控篇

数据识别网格绘图本次将主要介绍颜色调控的使用。颜色风格设置在seaborn的使用中，是可以针对数据类型而选择合适的颜色，并且使用选择的颜色进行可视化，节省了大量的可视化的颜色调整工作。还是一样，在介绍如何使用颜色外观设置之前，我们引入所需要的模块。为了修补

IT小牛的IT见解 2019-06-27

数据可视化Seaborn从零开始学习教程（一）风格选择

最近在做几个项目的数据分析，每次用到seaborn进行可视化绘图的时候总是忘记具体操作。虽然seaborn的官方网站已经详细的介绍了使用方法，但是毕竟是英文，而且查找不是很方便。因此博主想从零开始将seaborn学习一遍，做一个总结，也希望供大家使用参考。

comtop0 2019-06-27

滚滚熊的学习笔记

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号