pandas.DataFrame.plot.scatter
使用函数:
DataFrame.plot.scatter
(
x
,
y
,
s=None
,
c=None
,
**kwds
)
功能:
创建具有不同标记点大小和颜色的
散点图
。
每个点的坐标由两个数据帧列定义,实心圆用于表示每个点。这种图可用于查看两个变量之间的复杂相关性。点可以是例如自然2D坐标,例如地图中的经度和纬度,或者通常可以是可以相对于彼此绘制的任何一对度量。
参数:
|
x
: int or str
The column name or column position to be used as horizontal coordinates for each point.
用作每个点的水平坐标的列名称或列位置。
y
: int or str
The column name or column position to be used as vertical coordinates for each point.
用作每个点的垂直坐标的列名称或列位置。
s
: scalar or array_like, optional
The size of each point. Possible values are:
每个点的大小。可能的值是:
-
A single scalar so all points have the same size.
单个标量,所有点都具有相同的大小。
-
A sequence of scalars, which will be used for each point’s size recursively. For instance, when passing [2,14] all points size will be either 2 or 14, alternatively.
一系列标量,将递归地用于每个点的大小。例如,当传递[2,14]时,所有点的大小将为2或14,或者。
c
: str, int or array_like, optional
The color of each point. Possible values are:
每个点的颜色。可能的值是:
-
A single color string referred to by name, RGB or RGBA code, for instance ‘red’ or ‘#a98d19’.
由名称,RGB或RGBA代码引用的单个颜色字符串,例如“red”或“#a98d19”。
-
A sequence of color strings referred to by name, RGB or RGBA code, which will be used for each point’s color recursively. For intance [‘green’,’yellow’] all points will be filled in green or yellow, alternatively.
由名称、RGB或RGBA代码引用的一系列颜色字符串,它们将被递归地用于每个点的颜色。对于“绿色”,“黄色”的所有点都将被绿色或黄色填充。
-
A column name or position whose values will be used to color the marker points according to a colormap.
列名称或位置,其值将用于根据色彩图对标记点着色。
**kwds
Keyword arguments to pass on to
pandas.DataFrame.plot()
.
|
Returns:
|
axes
:
matplotlib.axes.Axes
or numpy.ndarray of them
|
import pandas as pd
import numpy as np
简单的散点图
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
ax = df.plot.scatter(x='a', y='b', color='b', label='Group 1')
df.plot.scatter(x='c', y='d', color='g', label='Group 2',ax=ax)
散点的点形状
df.plot.scatter(x='a', y='b',marker='x')
常用的Marker有:
Marker类型
|
散点形状
|
"."(点)
|
点
|
","(逗号)、"s"
|
像素(小正方形)
|
"o"
|
圈
|
"V"
|
倒三角
|
"^"
|
正三角
|
"<"
|
左三角
|
">"
|
右三角
|
"*"
|
星星
|
"x"
|
叉号
|
"+"
|
加号
|
df.plot.scatter(x='a', y='b', c='c', colormap='viridis')
常用颜色:
参数
|
颜色
|
b/blue
|
蓝色
|
c/cyan
|
蓝绿色
|
g/green
|
绿色
|
k/black
|
黑色
|
m/magenta
|
品红/分红
|
r/red
|
红色
|
w/white
|
白色
|
y/yellow
|
黄色
|
剩下的其余参数,详情请见
matplotlib scatter
文档和
matplotlib.pyplot
的相关参数。
pandas.DataFrame.plot.scatter 使用函数:DataFrame.plot.scatter(x, y, s=None, c=None, **kwds)功能:创建具有不同标记点大小和颜色的散点图。 每个点的坐标由两个数据帧列定义,实心圆用于表示每个点。这种图可用于查看两个变量之间的复杂相关性。点可以是例如自然2D坐标,例如地图中的经度和纬度,或者通常可以是...
简单绘制一个
散
点
图
。
数据
使用小朋友的身高和体重,简单看看。
数据
结构:下面看一下其中几条的部分内容,我们只需要其中身高(Height)和体重(Weight)列的
数据
:
共七万五千多条,下面看看通过
pandas
+matplotlib绘制出
散
点
图
。
注释写的很详细了,直接看代码很简单:
#!/usr/bin/env python3
# -*- coding: utf-8 -
X=pd.DataFrame.from_csv(loc)
#X = X.sort_index(by='label') 按照label排序
X = X.values #转换成熟悉的numpy
import matpl...
seaborn是python中的一个非常强大的
数据
可
视
化
库,它集成了matplotlib,下
图
为seaborn的官网,如果遇到疑惑的地方可以到官网查看。http://seaborn.pydata.org/
从官网的主页我们就可以看出,seaborn在
数据
可
视
化
上真的非常强大。
1.首先我们还是需要先引入库,不过这次要用到的python库比较多。
import numpy as np
import
pandas
as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
2.sns
讲在前面完整代码可在我的github上下载,Good Good Study,Day Day Up!
pandas
绘
图
显示 : plt.show()保存到本地 : plt.savefig(‘image.png’)%matplotlib inline
import
pandas
as pd
import matplotlib.pyplot as plt
present = pd.read_table('d
Pandas
库是一个强大的
数据
处理和分析工具,它提供了丰富的功能来进行
数据
可
视
化
。下面是一些常用的方法来使用
Pandas
库进行
数据
可
视
化
:
1. 使用`plot`方法:
Pandas
的DataFrame和Series对象都提供了一个`plot`方法,可以直接调用该方法来生成各种类型的
图
表,如折线
图
、柱状
图
、
散
点
图
等。例如,可以使用`df.plot()`来生成折线
图
,或者使用`df.plot(kind='bar')`来生成柱状
图
。
2. 使用Matplotlib库:
Pandas
库内置了对Matplotlib库的支持,可以使用
Pandas
的`plot`方法来生成
图
表,并通过Matplotlib库进行进一步的定制。例如,可以使用`df.plot().get_figure().savefig('plot.png')`将
图
表保存为
图
片文件。
3. 使用Seaborn库:Seaborn是一个基于Matplotlib的
数据
可
视
化
库,它提供了更高级别的统计
图
表和美观的默认样式。可以使用Seaborn库来绘制复杂的统计
图
表,如热力
图
、箱线
图
等。首先需要安装Seaborn库,然后可以通过调用Seaborn的函数来生成
图
表。
以上是一些常用的方法来使用
Pandas
库进行
数据
可
视
化
。当然,还有很多其他的方法和工具可以使用,具体使用哪种方法取决于你的需求和个人偏好。希望能对你有所帮助!