df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 3, 3],'B':[1, 4, 3, 2, 1, 3, 3],'C':[1, 4, 3, 2, 1, 3, 3]})
A B C
0 1 1 1
1 1 4 4
2 1 3 3
3 2 2 2
4 2 1 1
5 3 3 3
6 3 3 3
df['D'] = df[['A', 'B']].mean(axis=1)
A B C D
0 1 1 1 1.0
1 1 4 4 2.5
2 1 3 3 2.0
3 2 2 2 2.0
4 2 1 1 1.5
5 3 3 3 3.0
6 3 3 3 3.0
df.loc[:, 'E'] = np.mean([df['A'], df['B']], 0)
A B C D E
0 1 1 1 1.0 1.0
1 1 4 4 2.5 2.5
2 1 3 3 2.0 2.0
3 2 2 2 2.0 2.0
4 2 1 1 1.5 1.5
5 3 3 3 3.0 3.0
6 3 3 3 3.0 3.0
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 3, 3],'B':[1, 4, 3, 2, 1, 3, 3],'C':[1, 4, 3, 2, 1, 3, 3]}) df>>> A B C0 1 1 11 1 4 42 1 3 33 2 2 24 2 1 15 3 3 36 3 3 3df['D'] = df[['A...
Python pandas
Dataframe 求解每
列/行的均值
col_mean = df.mean(axis=0)
row_mean = df.mean(asxis=1)
axis: 0 是
列 1是行
在Excel 使用average先求取两格子的平均值,然后可以进一步拉两个格子求取整行/整列的平均值。
这在R语言中使用rowMeans求取多行平均值,或colMeans求取多列平均值
示例如下:
#create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
var2 = c(5, 5, 7, 8, 9),
var3 = c(2, 7, 9, 9, 7)
将
列表、数组、元组赋值为
DataFrame的
列,长度匹配即可
将Series赋值给
DataFrame的
列,二者的索引会精确匹配(索引不会合并,依旧是
DataFrame的索引)
若被赋值的
列不存在,则会创建一个新
列
2. 删除
DataFrame的
列(del)
3.
DataFrame的name和values属性
DataFrame.index.name
DataFrame.columns..