本文详细介绍了在Python的Pandas库中,如何利用loc和iloc方法来检索DataFrame的数据。loc方法主要通过行和列的名称进行索引,例如读取特定行、列或条件筛选数据;而iloc则依赖于行和列的索引位置,适用于基于位置的检索。文中通过实例展示了这两种方法的各种用法,包括单行、单列、多个区域的选择以及切片操作,帮助读者更好地理解和应用这两个功能强大的检索工具。
摘要由CSDN通过智能技术生成
# 生成DataFrame
data = pd.DataFrame(np.arange(30).reshape((6,5)),
columns=['A','B','C','D','E'])
# 写入本地
data.to_excel("D:\\实验数据\\data.xls", sheet_name="data")
print(data)
1.loc方法
loc方法是通过行、列的名称或者标签来寻找我们需要的值。
(1)读取第二行的值
# 索引第二行的值,行标签是“1”
data1 = data.loc[1]
#下面两种语法效果相同
data.loc[1] == data.loc[1,:]
(2)读取第二列的值
# 读取第二列全部值
data2 = data.loc[ : ,"B"]
(3)同时读取某行某列
# 读取第1行,第B列对应的值
data3 = data.loc[ 1, "B"]
(4)读取DataFrame的某个区域
# 读取第1行到第3行,第B列到第D列这个区域内的值
data4 = data.loc[ 1:3, "B":"D"]
(5)根据条件读取
# 读取第B列中大于6的值
data5 = data.loc[ data.B > 6] #等价于 data5 = data[data.B > 6]
(6)也可以进行切片操作
# 进行切片操作,选择B,C,D,E四列区域内,B列大于6的值
data1 = data.loc[ data.B >6, ["B","C","D","E"]]
2.iloc方法
iloc方法是通过索引行、列的索引位置[index, columns]来寻找值
(1)读取第二行的值
# 读取第二行的值,与loc方法一样
data1 = data.iloc[1]
# data1 = data.iloc[1, :],效果与上面相同
(2)读取第二列的值
# 读取第二列的值
data1 = data.iloc[:, 1]
(3)同时读取某行某列
# 读取第二行,第二列的值
data1 = data.iloc[1, 1]
(4)进行切片操作
# 按index和columns进行切片操作
# 读取第2、3行,第3、4列
data1 = data.iloc[1:3, 2:4]
这里的区间是左闭右开,data.iloc[1:3, 2:4]中的第4行、第5列取不到
文章目录1.普通方法筛选2.
loc(纯标签筛选)3.
iloc(纯数字筛选)4.ix(标签与数字的混合筛选)5.判断条件筛选
1.普通方法筛选
我们首先构造了一个 5X4 的矩阵
数据。
import
pandas as pd
import numpy as np
dates = pd.date_range('20200315', periods = 5)
df = pd.
DataFrame(np.arange(20).reshape(5,4), index = dates, columns = ['A', 'B','C','D'])
print(df)
快速浏览pandas简单介绍和本系列说明一、csv、txt、xls或xlsx文件读取与写入1. 读取与写入csv格式2. 读取与写入txt格式3. 读取与写入xls或xlsx格式二、基本数据结构1. SeriesSeries创建访问Series属性Series调用方法2. DataFrameDataFrame创建DataFrame修改行/列名DataFrame调用属性和方法“索引对齐特性”DataFrame列的删除/增加DataFrame根据类型选择列DataFrame转置Series转换为DataFrame三、常用基本函数head和tailunique和nuniquecount和value_
问题:iloc函数是干什么的?
回答:在数据分析过程中,很多时候需要从数据表中提取出相应的数据,而这么做的前提是需要先“索引”出这一部分数据。iloc函数,属于pands库,全称为index location,即对数据进行位置(location)索引(index)。
问题:iloc函数怎么用?
回答:iloc[a,b],其中a是行数,b是列数。具体a和b的输入有以下几种形式:
1.iloc[a,b]:取第a行第b列的数据。
注意,在iloc中认为数据中的行数和列数都是如图这样定义的
图1...
iloc在
索引中的位置上起作用(因此仅采用整数)。
(1)
loc的
用法
data.
loc[:,'列一'] #取出所有行第一列,
loc可以理解为传入两个参数一个是关于行的,一个是关于列的。
data.
loc[:,['列一','列四','列三']] #取出所有行多列,就把列名包裹成列表的形式。
data.
loc[0:5,['列一','列四','列三']] #取出某几行某几列,把行
索引和列名传入。
data.
loc[
data['列四']==138
在Python的Pandas库中,你可以使用`read_csv()`函数读取CSV文件,并通过指定列名和特定的数据范围来获取部分数据。以下是一个简单的示例:
```python
import pandas as pd
# 假设你有一个名为"data.csv"的文件,其中包含一列名为'column_name'的数据
df = pd.read_csv('data.csv')
# 如果你想从'column_name'列中获取第5行到第10行的数据,可以这样做:
selected_data = df['column_name'].iloc[4:10]
# `iloc`是基于位置的索引,这里4表示起始位置(包括第5行),10表示结束位置(不包括第11行)
# 如果数据是从0开始计数的,那么就是range(4, 10)
# 这样就得到了指定列中的一部分数据,存储在一个Series对象中
如果你需要更复杂的筛选条件,例如基于某些条件选择行,可以结合`loc`或布尔索引来实现:
```python
condition = df['another_column'] == 'some_value'
filtered_data = df.loc[(df['column_name'].between(start_value, end_value)) & condition]
在这里,`between(start_value, end_value)`用于指定'column_name'列的值范围。