我们在读取csv文件的时候,有的时候可能没有表头,或者想换一个表头,该怎么操作?df = pd.read_csv('data.csv', sep='\t',header=None, names=['var_code','var_name','var_desc'])```
pd
.
read
_
csv
()方法中header参数,默认为0,标签为0(即第1行)的行为
表头
。若设置为-1,则无
表头
。示例如下:
(1)不设置header参数(默认)时:
df1 =
pd
.
read
_
csv
('target.
csv
',encoding='utf-8')
(2)header=1时:
import
pandas
as
pd
df2 =
pd
.
read
_
csv
('target.
csv
',encoding='utf-8',header=1)
(3)header=-1时(可用于
读取
无
表头
CSV
文件
):
df3 =
pd
.
read
_
csv
('target.
pd
.
read
_
csv
()方法中header参数,默认为0,标签为0(即第1行)的行为
表头
。若设置为-1,则无
表头
。示例如下:
(1)不设置header参数(默认)时:
df1 =
pd
.
read
_
csv
('target.
csv
',encoding='utf-8')
(2)header=1时:
import
pandas
as
pd
df2 =
pd
.r...
Python
-
pandas
读取
无
表头
的
csv
/xlsx
文件
&
加上
指定
表头
(相当于无
表头
也保留了第一行数据)
Python
-
pandas
读取
无
表头
的
csv
/xlsx
文件
获取全部数据
pandas
读取
无
表头
如何保留第一行数据
pandas
读取
excelbu跳过第一行
import numpy as np
import
pandas
as
pd
train_data =
pd
.
read
_
csv
('./data/train.
csv
', sep=',')
train_data.head()
结果是显...
让header等于None即可
df =
pd
.
read
_
csv
(filename, encoding='gbk', header=None)
df.columns=['calc_time','data_date','station_id','pm25_value','pm10_value','co_value','no2_value','so2_value','o3_1h_value','o3_8h_value']
有
表头
的时候这样做会报错。
用
pandas
处理.
csv
文件
时,有时我们希望保存的.
csv
文件
没有
表头
,于是我去看了DataFrame.to_
csv
的document。
发现只需要再添加header=None这个参数就行了(默认是True),
下面贴上document:
DataFrame.to_
csv
(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quo
Merge/Join .
csv
(合并
csv
文件
)
import
pandas
as
pd
ratings =
pd
.
read
_
csv
('C:/Users/Can/Desktop/RS Project/ratings.
csv
')
movies=
pd
.
read
_
csv
('C:/Users/Can/Desktop/RS Project/movies.
csv
')
ratings.
csv
: users’ rating of movies
movies.
csv
: movies description
Merge合并
把两个
csv
文件
合并,显示出每位用户给电影的打分以及电影详情。
data = p
. 在使用
pandas
read
_
csv
然后转换成DataFrame
import
pandas
as
pd
data =
pd
.
read
_
csv
('name_
csv
') #
读取
本地
文件
#data =
pd
.
read
_
csv
('http://localhost/name.
csv
') #
读取
URL上的
csv
文件
#data =
pd
.
read
_
csv
(open('name.
csv
', encoding='utf-8')) #打开
文件
的方式
读取
文件
可以使用
pd
.
read
_excel函数来
读取
不同sheet。例如,如果要
读取
名为“Sheet1”和“Sheet2”的两个sheet,可以使用以下代码:
```
python
import
pandas
as
pd
#
读取
Excel
文件
excel_file =
pd
.ExcelFile('
文件
路径.xlsx')
#
读取
Sheet1
df1 =
pd
.
read
_excel(excel_file, sheet_name='Sheet1')
#
读取
Sheet2
df2 =
pd
.
read
_excel(excel_file, sheet_name='Sheet2')
其中,`
pd
.ExcelFile`函数用于打开Excel
文件
,`sheet_name`参数用于
指定
要
读取
的sheet名称。
读取
后的数据将存储在DataFrame对象中,可以进行进一步的数据处理和分析。