我想用自定义agg函数对我的spark df进行groupBy。
def gini(list_of_values):
sth is processing here
return number output
我想得到这样的结果。
df.groupby('activity')['mean_event_duration_in_hours].agg(gini)
能否请您帮助我解决这个问题?
![]() |
乖乖的感冒药 · 【学术自检】学术不端13宗罪,你犯过吗?-科研处· 5 月前 · |
![]() |
乖乖的香菜 · Aaron Judge - 台灣棒球維基館· 5 月前 · |
![]() |
侠义非凡的葫芦 · 裸绞制服恶犬!可行不可行?_哔哩哔哩_bil ...· 8 月前 · |
![]() |
风流的鞭炮 · 一对多关系 - EF Core | ...· 9 月前 · |
![]() |
开心的炒粉 · 小米3路由器ttl刷机教程 - CSDN文库· 10 月前 · |
![]() |
乖乖的感冒药 · 【学术自检】学术不端13宗罪,你犯过吗?-科研处 5 月前 |
![]() |
乖乖的香菜 · Aaron Judge - 台灣棒球維基館 5 月前 |
![]() |
开心的炒粉 · 小米3路由器ttl刷机教程 - CSDN文库 10 月前 |