35_
Pandas计算满足特定条件的元素的数量
将说明在
pandas.DataFrame和
pandas.Series中,如何按行/列以及整体来计算满足特定条件的元素数。
请参阅以下文章,了解如何提取符合条件的行。
09_
Pandas从多个条件(AND,OR,NOT)中提取行
另外,如果要为每一列计算唯一元素,请参见以下文章。
15_
Pandas计算元素的数量和频率(出现的次数)
对以下内容进行具体的说明。
满足特定条件的元素数量的
计数流程
计数pandas.DataFrame中的任何列
比如说有一个名为 df1 的dataframe
要统计某一列(比如说列名是city)中各个值出现的次数
#可以通过df.colname 来指定某个列,value_count()在这里进行计数
df2 = df1.city.value_counts()
print(df2)
假设有 5 个人,分别参加了 4 门课程,获得了对应的分数
同时这个 5 个人分别负责的项目个数 在 ‘Project_num’ 列中显示
data = {‘name’ : pd.Series([‘Alice’, ‘Bob’, ‘Cathy’, ‘Dany’, ‘Ella’, ‘Ford’, ‘Gary’, ‘Ham’, ‘Ico’, ‘Jack’]),
'Math_A' : pd.Series([1.1, 2.2, 3.3, 4.4, 5, 3
python中的pandas可以方便地生成透视表,读取原始数据。
>>> df = pd.DataFrame(pd.read_excel('测试数据.xlsx',sheet_name = 'Sheet1'))
编号 客户 商品 金额 付款
0 100 张三 苹果 10 是
1 100 张三 香蕉 20 ...
df = df["推广计划"].value_counts().rename_axis('unique_values').reset_index(name='counts')
unique_values counts
0 7 1
1 1 1
在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有多少个不同的数据值,并计算每个不同值在该列中的个数,同时还能根据需要进行排序。
函数体及主要参数:
value_counts(values,sort=True, ascending=False,
normalize=False,bins=None,dropna=True)
参数说明:
sort=True: 是否要进行排序;默认进行排序
ascending=False: 默认降序排列;
normalize