相关文章推荐
才高八斗的冰棍  ·  super.parseUnknownFiel ...·  1 年前    · 
失恋的柿子  ·  No.6_1 OpenCL ...·  1 年前    · 

1 pandas简介


1.Pandas是什么?


Pandas是一个强大的分析结构化数据的工具集;


它的使用基础是Numpy(提供高性能的矩阵运算);


用于数据挖掘和数据分析,同时也提供数据清洗功能。

2.DataFrame


DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。


pandas 相当于 python 中 excel:它使用表(也就是 dataframe),能在数据上做各种变换,但还有其他很多功能。


class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)


image.png


3.Series


它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。


4.pandas 网址


官网: https://pandas.pydata.org/


中文网: https://www.pypandas.cn/


2 导入


image.png


还需要执行以下导入才能开始:


import pandas as pd
import numpy as np


3 使用

# 使用Pandas
>>> import pandas as pd
>>> df = pd.DataFrame() 
>>> print(df)
# 输出结果
Empty DataFrame
Columns: []
Index: []

4 读取、写入

import pandas as pd
df = pd.read_excel("D:/项目/资料/People.xlsx")     # 把文件读到内存中形成DataFrame
print(df.shape)     # 读取文件行数和列数
print(df.columns)   # 读取列名
print(df.head(3))   # 打印前3行
print(df.tail(3))   # 打印后3行
df = pd.DataFrame({"ID":[1,2,3],"Name":["jack","小明","小红"]})
df = df.set_index("ID")     # 把ID那一列当索引,并产生新的DataFrame
df.to_excel("D:/项目/我爱你.xlsx")   # 写入文件
print("Done!")
                Python库函数pandas读取excel数据
            
pandas 读取excel文件使用的是 read_excel方法。本文将详细解析read_excel方法的常用参数,以及实际的使用示例
pandas读excel类型文件报错: xlrd.biffh.XLRDError: Excel xlsx file; not supported
pandas读excel类型文件报错: xlrd.biffh.XLRDError: Excel xlsx file; not supported
羡慕 Excel 的高级选择与文本框颜色呈现?Pandas 也可以拥有!! ⛵
通过 Styler API 的设置,Pandas 也能像 Excel 那样进行『条件选择』和 『文本框颜色』设置,一眼获取最关键信息!本文讲解 Pandas 使用单色(或渐变色)高亮显示缺失值、最大值、最小值、范围值等【数据与代码亲测可运行】