pandas.DataFrame.plot.scatter

使用函数: DataFrame.plot.scatter ( x , y , s=None , c=None , **kwds )

功能: 创建具有不同标记点大小和颜色的 散点图

每个点的坐标由两个数据帧列定义,实心圆用于表示每个点。这种图可用于查看两个变量之间的复杂相关性。点可以是例如自然2D坐标,例如地图中的经度和纬度,或者通常可以是可以相对于彼此绘制的任何一对度量。

参数:

x : int or str

The column name or column position to be used as horizontal coordinates for each point.

用作每个点的水平坐标的列名称或列位置。

y : int or str

The column name or column position to be used as vertical coordinates for each point.

用作每个点的垂直坐标的列名称或列位置。

s : scalar or array_like, optional

The size of each point. Possible values are:

每个点的大小。可能的值是:

  • A single scalar so all points have the same size.

单个标量,所有点都具有相同的大小。

  • A sequence of scalars, which will be used for each point’s size recursively. For instance, when passing [2,14] all points size will be either 2 or 14, alternatively.

一系列标量,将递归地用于每个点的大小。例如,当传递[2,14]时,所有点的大小将为2或14,或者。

c : str, int or array_like, optional

The color of each point. Possible values are:

每个点的颜色。可能的值是:

  • A single color string referred to by name, RGB or RGBA code, for instance ‘red’ or ‘#a98d19’.

由名称,RGB或RGBA代码引用的单个颜色字符串,例如“red”或“#a98d19”。

  • A sequence of color strings referred to by name, RGB or RGBA code, which will be used for each point’s color recursively. For intance [‘green’,’yellow’] all points will be filled in green or yellow, alternatively.

由名称、RGB或RGBA代码引用的一系列颜色字符串,它们将被递归地用于每个点的颜色。对于“绿色”,“黄色”的所有点都将被绿色或黄色填充。

  • A column name or position whose values will be used to color the marker points according to a colormap.

列名称或位置,其值将用于根据色彩图对标记点着色。

**kwds

Keyword arguments to pass on to pandas.DataFrame.plot() .

Returns:

axes : matplotlib.axes.Axes or numpy.ndarray of them

import pandas as pd
import numpy as np

简单的散点图

df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
ax = df.plot.scatter(x='a', y='b', color='b', label='Group 1')
df.plot.scatter(x='c', y='d', color='g', label='Group 2',ax=ax)

散点的点形状

df.plot.scatter(x='a', y='b',marker='x')

常用的Marker有:

Marker类型 散点形状
"."(点)
","(逗号)、"s" 像素(小正方形)
"o"
"V" 倒三角
"^" 正三角
"<" 左三角
">" 右三角
"*" 星星
"x" 叉号
"+" 加号
df.plot.scatter(x='a', y='b', c='c', colormap='viridis')

常用颜色:

参数 颜色
b/blue 蓝色
c/cyan 蓝绿色
g/green 绿色
k/black 黑色
m/magenta 品红/分红
r/red 红色
w/white 白色
y/yellow 黄色

剩下的其余参数,详情请见 matplotlib scatter 文档和 matplotlib.pyplot 的相关参数。

pandas.DataFrame.plot.scatter 使用函数:DataFrame.plot.scatter(x, y, s=None, c=None, **kwds)功能:创建具有不同标记点大小和颜色的散点图。 每个点的坐标由两个数据帧列定义,实心圆用于表示每个点。这种图可用于查看两个变量之间的复杂相关性。点可以是例如自然2D坐标,例如地图中的经度和纬度,或者通常可以是...
简单绘制一个 数据 使用小朋友的身高和体重,简单看看。 数据 结构:下面看一下其中几条的部分内容,我们只需要其中身高(Height)和体重(Weight)列的 数据 : 共七万五千多条,下面看看通过 pandas +matplotlib绘制出 。 注释写的很详细了,直接看代码很简单: #!/usr/bin/env python3 # -*- coding: utf-8 -
X=pd.DataFrame.from_csv(loc) #X = X.sort_index(by='label') 按照label排序 X = X.values #转换成熟悉的numpy import matpl...
seaborn是python中的一个非常强大的 数据 库,它集成了matplotlib,下 为seaborn的官网,如果遇到疑惑的地方可以到官网查看。http://seaborn.pydata.org/ 从官网的主页我们就可以看出,seaborn在 数据 上真的非常强大。 1.首先我们还是需要先引入库,不过这次要用到的python库比较多。 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns 2.sns
讲在前面完整代码可在我的github上下载,Good Good Study,Day Day Up! pandas 显示 : plt.show()保存到本地 : plt.savefig(‘image.png’)%matplotlib inline import pandas as pd import matplotlib.pyplot as plt present = pd.read_table('d
Pandas 库是一个强大的 数据 处理和分析工具,它提供了丰富的功能来进行 数据 。下面是一些常用的方法来使用 Pandas 库进行 数据 : 1. 使用`plot`方法: Pandas 的DataFrame和Series对象都提供了一个`plot`方法,可以直接调用该方法来生成各种类型的 表,如折线 、柱状 等。例如,可以使用`df.plot()`来生成折线 ,或者使用`df.plot(kind='bar')`来生成柱状 。 2. 使用Matplotlib库: Pandas 库内置了对Matplotlib库的支持,可以使用 Pandas 的`plot`方法来生成 表,并通过Matplotlib库进行进一步的定制。例如,可以使用`df.plot().get_figure().savefig('plot.png')`将 表保存为 片文件。 3. 使用Seaborn库:Seaborn是一个基于Matplotlib的 数据 库,它提供了更高级别的统计 表和美观的默认样式。可以使用Seaborn库来绘制复杂的统计 表,如热力 、箱线 等。首先需要安装Seaborn库,然后可以通过调用Seaborn的函数来生成 表。 以上是一些常用的方法来使用 Pandas 库进行 数据 。当然,还有很多其他的方法和工具可以使用,具体使用哪种方法取决于你的需求和个人偏好。希望能对你有所帮助!