在敲代码的过程中,老是会遇到在Dataframe中新添加一列的情况,每次都要重新google,这次做个记录。
-
其实在Dataframe中新添加一列很简单,直接指明列名,然后赋值就可以了。
import pandas as pd
data = pd.DataFrame(columns=['a','b'], data=[[1,2],[3,4]])
0 1 2
1 3 4
下面我们添加一列’c‘,赋值为空白值。打印出来,我们可以看到已经成功添加了一列’c'。
data['c'] = ''
a b c
0 1 2
1 3 4
我们再来添加一列‘d',赋值为一个list。可以看到成功添加啦。
data['d'] = [5,6]
a b c d
0 1 2 5
1 3 4 6
我每次都记不住的原因主要是因为我都想要加一个空列,然后我就是这样加的?,就会爆一长串的错误。
data['e'] = []
-
如果需要在指定的位置添加新的一列,可以使用insert( )方法。
我们分别在原来的dataframe的开始和最后添加两列 ’c' 和 ‘d'。 大家可以点击
链接
查看具体的参数。
data.insert(2,'c','')
# 2 :插入的列的位置
# ‘c':待插入列的列名
# ‘ ’:插入的值,这里插入的是空值
Out[56]:
a b c
0 1 2
1 3 4
data.insert(0,'d',[1,2])
Out[71]:
d a b c
0 1 1 2
1 2 3 4
【Python】【 DataFrame】判断某一列的值是否包含另一列的值
在敲代码的过程中,老是会遇到在Dataframe中新添加一列的情况,每次都要重新google,这次做个记录。其实在Dataframe中新添加一列很简单,直接指明列名,然后赋值就可以了。import pandas as pddata = pd.DataFrame(columns=['a','b'], data=[[1,2],[3,4]])data>>> dat...
一、更改
DataFrame
的某些值
1、更改
DataFrame
中的数据,原理是将这部分数据提取出来,重新赋值为新的数据。
2、需要注意的是,数据更改直接针对
DataFrame
原数据更改,操作无法撤销,如果做出更改,需要对更改条件做确认或对数据进行备份。
import pandas as pd
df1 = pd.
DataFrame
([['Snow','M',22],['Tyrion','M',32],['Sansa','F',18],['Arya','F',14]], columns=['name','gender','age'])
print(--------更换单个值------
在Pandas的
DataFrame
中
添加
一行或者
一列
,
添加
行有df.loc[]以及df.append()这两种方法,
添加
列有df[]和df.insert()两种方法, 下面对这几种方法的使用进行简单介绍。
一、
添加
行
添加
一行,采用loc[]方法
# 构造一个空的
dataframe
import pandas as pd
df = pd.
DataFrame
(columns=['name','number'])
# 采用.loc的方法进行
df.loc[0]=['cat', 3] # 其中loc[
3、根据现有列计算生成新的列
dataframe
根据某列的值生成新的列
df2[‘是否逾期’]=df2.apply(lambda x:0 if x.应付日期>today_time else 1,axis=1)
df2[‘是否到期90天’]=(today_time -
先说个题外话,如何给hive表增加一个列,并且该把该列的所有字段设为’China’?
如果仅仅是增加
一列
倒是很简单:
alter table test add columns(flag string)
可要把这个flag字段全部设置为China,看起来的确是有点难度,因为往Hive表中装载数据的唯一途径就是使用一种“大量”的数据装载操作(如何往Hive表加载数据请参考),这个时候,如果数据...
DataFrame
.insert(loc, column, value, allow_duplicates=False)[source]
Insert column into
DataFrame
at specified location.
Raises a ValueError if column is already contained in the
DataFrame
, unless al...
通常,您可能希望在 Pandas
DataFrame
中插入一个新列。幸运的是,使用 pandasinsert()函数很容易做到这一点,该函数使用以下语法:insert(loc, column, value, allow_duplicates=False)在哪里:本教程展示了如何在实践中使用此功能的几个示例。以下代码显示了如何插入一个新列作为现有
DataFrame
的第
一列
:
示例 2:插入新列作为中间列
以下代码显示了如何插入一个新列作为现有
DataFrame
的第三列:
示例 3:插入新列作为最后一
df.set_index([Column], inplace=True)
以上这篇
Python
将
DataFrame
的某
一列
作为index的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。
您可能感兴趣的文章:
python
给
DataFrame
增加index行名和columns列名的实现方法用pandas中的
DataFrame
时选取行或列的方法
python
中pandas.
DataFrame
对行与列求和及
添加
新行与列示例pandas数据处理基础之筛选
1. 创建一个字典,其中包含新行的数据。键是列名称,值是要
添加
的值。
2. 使用
DataFrame
的append()方法
添加
新行。请注意,append()方法将返回一个新的
DataFrame
,因此您需要将其分配给一个变量。
以下是一个示例代码,演示如何在
DataFrame
中
添加
一行:
```
python
import pandas as pd
# 创建一个
DataFrame
df = pd.
DataFrame
({'A': [1, 2, 3], 'B': [4, 5, 6]})
# 创建一个字典,包含新行的数据
new_row = {'A': 7, 'B': 8}
# 使用append()方法
添加
新行
df = df.append(new_row, ignore_index=True)
# 显示更新后的
DataFrame
print(df)
0 1 4
1 2 5
2 3 6
3 7 8
请注意,我们在append()方法中使用了ignore_index=True参数,以确保新行的索引将自动分配为递增的数字序列。如果不使用此参数,新行的索引将是原始
DataFrame
中的最大索引值加1。