5分钟掌握Pandas GroupBy

相关文章推荐

不拘小节的皮带 · 创建分页报表的动态订阅（预览版） - ...· 9 月前 ·

体贴的抽屉 · Nodejs进阶：如何玩转子进程（child ...· 1 年前 ·

绅士的围巾 · listbox的item双击事件-掘金· 1 年前 ·

一身肌肉的山楂 · c++ read lines from ...· 1 年前 ·

逃跑的骆驼 · unity ...· 1 年前 ·

 import pandas as pd
 import numpy as np
 from sklearn.datasets import fetch_openml
 X,y = fetch_openml(name='credit-g', as_frame=True, return_X_y=True)
 df = X
 df['target'] = y
 df.head()

 df.groupby(['job']).mean()

 data[['job', 'credit_amount']].groupby(['job']).mean()

 data[['job', 'housing','credit_amount']].groupby(['job', 'housing']).mean()

 data[['job', 'credit_amount']].groupby(['job']).agg([min, max])

 df[['job', 'credit_amount', 'age']].groupby(['job']).agg(
     {'credit_amount': ['min', 'max'], 'age': 'mean'})

 df[['target', 'credit_amount', 'age']].groupby('target').agg(
     min_credit_amount=pd.NamedAgg('credit_amount', 'min'),
     max_credit_amount=pd.NamedAgg('credit_amount', 'max'),
     average_age=pd.NamedAgg('age', 'mean'))

 job_count = df[['job', 'target']].groupby(['job', 'target']).agg({'target': 'count'})
 job_percent = job_count.groupby(level=0).apply(lambda x:
                                                  100 * x / float(x.sum()))
 job_percent

推荐文章

不拘小节的皮带 · 创建分页报表的动态订阅（预览版） - Power BI | Microsoft Learn

9 月前

体贴的抽屉 · Nodejs进阶：如何玩转子进程（child_process）-腾讯云开发者社区-腾讯云

1 年前

绅士的围巾 · listbox的item双击事件-掘金

1 年前

一身肌肉的山楂 · c++ read lines from file into vector-掘金

1 年前

逃跑的骆驼 · unity 预定义类型system.void未定义或导入怎么解决？_百度知道

1 年前

deephub

5分钟掌握Pandas GroupBy

数据

基本用法

多聚合

聚合命名

自定义聚合

可视化绘图