我想用自定义agg函数对我的spark df进行groupBy。
def gini(list_of_values):
sth is processing here
return number output
我想得到这样的结果。
df.groupby('activity')['mean_event_duration_in_hours].agg(gini)
能否请您帮助我解决这个问题?
![]() |
帅气的领带 · 【Pyspark ...· 2 周前 · |
![]() |
时尚的蘑菇 · pyspark的窗口函数--Window、o ...· 2 周前 · |
![]() |
千年单身的长颈鹿 · TypeScript基础入门 - 函数 - ...· 9 月前 · |
![]() |
文武双全的铅笔 · WPF优化:Freezable冻结对象-CS ...· 1 年前 · |
![]() |
爱喝酒的圣诞树 · 基于jQuery的公告无限循环滚动实现代码- ...· 1 年前 · |
![]() |
高大的柿子 · mapstruct ...· 1 年前 · |
![]() |
闷骚的跑步鞋 · oracle ...· 1 年前 · |