相关文章推荐
光明磊落的墨镜  ·  pandas ...·  2 周前    · 
旅途中的牛腩  ·  python ...·  1 周前    · 
酷酷的作业本  ·  Xcode ...·  2 年前    · 
飘逸的黄瓜  ·  loss曲线震荡分析 - 掘金·  2 年前    · 
买醉的吐司  ·  grpc 断线重连-掘金·  2 年前    · 

value_counts() 是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。

本来是 Series 拥有的方法,统计所有非零元素的个数,默认以降序的方式输出Series,一般在 DataFrame 中使用时,需要指定对哪一列或行使用。

在Series类型中:

只有一条数据,不需要指定列数:

import pandas as pd
df = pd.Series([1, 2, 4, 7, 2, 5, 2, 1],
				index=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(df.value_counts())

在DataFrame类型中:

先直接导入一个 DataFrame 对象:

import pandas as pd
df = pd.read_csv('movies.csv', encoding='utf-8')
print(df.head())

看一下里面的内容:
在这里插入图片描述
由第一行的索引来确定计数哪一列

统计统一年份的电影数量:

year = df["年份"].value_counts().head()
print(year)

得到:
在这里插入图片描述
统计每个导演所拍电影的数量:

director = df['导演'].value_counts().head()
print(director)

value_counts() 返回的结果是一个 Series 数组,可以跟别的数组进行运算。

value_counts() 函数是针对 Series 的,不是针对 DataFrame 的,所以只能是单列。

value_counts() 是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。是 Series 拥有的方法,统计所有非零元素的个数,默认以降序的方式输出Series,一般在 DataFrame 中使用时,需要指定对哪一列或行使用。在Series类型中:只有一条数据,不需要指定列数:import pandas as pd...
pandas的简单使用--数据统计统计汇总类统计(针对数值型)描述性统计(针对数值型)相关系数和协方差(针对数值型)不挑类型的统计groupby分组统计单个列groupby,查询所有数据列的统计多个列groupby,查询所有数据列的统计同时查看多种数据统计查看单列的结果数据统计不同列使用不同的聚合函数遍历groupby的结果理解执行流程遍历单个列聚合的分组遍历多个列聚合的分组 汇总类统计(针对数值型) # 统计每一列的个数 df.count() # 统计值的个数(一般搭配列使用) # 不加列df.
35_Pandas计算满足特定条件的元素的数量 将说明在pandas.DataFrame和pandas.Series中,如何按行/列以及整体来计算满足特定条件的元素数。 请参阅以下文章,了解如何提取符合条件的行。 09_Pandas从多个条件(AND,OR,NOT)中提取行 另外,如果要为每一列计算唯一元素,请参见以下文章。 15_Pandas计算元素的数量和频率(出现的次数) 对以下内容进行具体的说明。 满足特定条件的元素数量的计数流程 计数pandas.DataFrame中的任何列
比如说有一个名为 df1 的dataframe 要统计某一列(比如说列名是city)中各个值出现的次数 #可以通过df.colname 来指定某个列,value_count()在这里进行计数 df2 = df1.city.value_counts() print(df2) 假设有 5 个人,分别参加了 4 门课程,获得了对应的分数 同时这个 5 个人分别负责的项目个数 在 ‘Project_num’ 列中显示 data = {‘name’ : pd.Series([‘Alice’, ‘Bob’, ‘Cathy’, ‘Dany’, ‘Ella’, ‘Ford’, ‘Gary’, ‘Ham’, ‘Ico’, ‘Jack’]), 'Math_A' : pd.Series([1.1, 2.2, 3.3, 4.4, 5, 3
python中的pandas可以方便地生成透视表,读取原始数据。 >>> df = pd.DataFrame(pd.read_excel('测试数据.xlsx',sheet_name = 'Sheet1')) 编号 客户 商品 金额 付款 0 100 张三 苹果 10 是 1 100 张三 香蕉 20 ...
df = df["推广计划"].value_counts().rename_axis('unique_values').reset_index(name='counts') unique_values counts 0 7 1 1 1 1
pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值在该列中的个数,同时还能根据需要进行排序。 函数体及主要参数: value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True) 参数说明: sort=True: 是否要进行排序;默认进行排序 ascending=False: 默认降序排列; normalize