pyspark报错，'DataFrame' object has no attribute '_jdf'_大数据-CSDN问答

你好呀，汪同学！ 2022-04-29 16:55 采纳率: 86.1%
浏览 569

首页

已结题

pyspark报错，'DataFrame' object has no attribute '_jdf'

spark

python

dataZscore：

dataZscore = (dataTransformed - dataTransformed.mean(axis=0)) /dataTransformed.std(axis=0) dataZscore.columns = ['Z' + i for i in dataTransformed.columns] dataZscore.head() ZL ZR ZF ZM ZC 0 1.435707 -0.944948 14.034016 26.761154 0.315041 1 1.307152 -0.911894 9.073213 13.126864 0.315041 2 1.328381 -0.889859 8.718869 12.653481 0.315041 3 0.658476 -0.416098 0.781585 12.540622 0.315041 4 0.386032 -0.922912 9.923636 13.898736 0.315041 #Kmeans #导入工具包 import time import pyspark.ml.clustering as clu # 获取程序运行前时间 start = time.time() #通过上图观察可知最好的簇数量为5 #初始化Kmeans模型 kmodel = clu.KMeans(k=5, initMode='k-means||', initSteps=10,maxIter=300, seed=0) kmodel.fit(dataZscore) # # 获取程序运行结束后时间 # end = time.time() # print(f"使用K-means聚类算法的运行时间为：%.3fs" % (end-start)) # # 聚类算法的评价指标CH值的计算： # score = calinski_harabaz_score(dataZscore, labels) # 至越大表示聚类效果越好 # print("CH值：", score) 一直报错，没办法解决 'DataFrame' object has no attribute '_jdf' 0 提建议微信扫一扫点击复制链接分享邀请回答编辑收藏删除收藏举报追加酬金 (90%的用户在追加酬金后获得了解决方案) 当前问题酬金 ¥ 0 (可追加 ¥500）支付方式扫码支付加载中... 提供问题酬金的用户不参与问题酬金结算和分配支付即为同意《付费问题酬金结算规则》

码龄粉丝数原力等级 --

pyspark报错，'DataFrame' object has no attribute '_jdf'

1 条回答默认最新

码龄粉丝数原力等级 --

问题事件

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

悬赏问题

pyspark报错，'DataFrame' object has no attribute '_jdf'

1 条回答 默认 最新

问题事件

悬赏问题

1 条回答默认最新