DataFrame基础知识_ttt_tangyuan的博客

初始化空的DataFrame

import pandas as pd
empty_df = pd.DataFrame(columns=['A','B','C','D'])
创建了四列，每一列的内容都是空的 
展示数据规模
 
1、行数和列数
 
df.shape
2、按某一列名统计数据
 
df.groupby('column_name').count()
DataFrame数据拼接合并
 
pd.merge()
 
a=pd.DataFrame({'a':[1,2,3],'b':[2,3,4]})
b=pd.DataFrame({'a':[11,22,33],'c':[22,33,44]})
c=pd.merge(a,b)
a和b的同名列表被合并，但是都是空说明默认连接形式是内连接，即二者默认把相同列名作为查找的条件，若是查找不到相同的值返回空。 
加入连接条件
 
c=pd.merge(a,b,how='outer',on='a')
pd.concat()
 
pd.concat(a,b)
# 横向拼接
pd.concat([a,b], axis=1)
# 纵向拼接
pd.concat([a,b], axis=0)
TypeError: first argument must be an iterable of pandas objects, you passed an object of type "DataFrame"
使用pandas.concat(a,b)进行合并的时候，需要是list的形式 
pd.concat([a,b])

 它把a,b两个表完全拼接在一起，默认拼接形式是并集，我们可以通过修改参数来修改拼接模式，以及拼接方向，也可以重述索引。 
d=pd.concat([a,b])
d.index=list(range(0,6))
通过赋值语句可以使得单列数据的拼接。 
e=pd.Series(list('abc'))
a['c']=e
DataFrame.join()
 
a.join(b)
ValueError: columns overlap but no suffix specified: Index(['a', 'c'], dtype='object')
列表不能有重名 
按行遍历 DataFrame
 
iterrows(): 按行遍历，将DataFrame的每一行迭代为(index, Series)对，可以通过row[name]对元素进行访问。
itertuples(): 按行遍历，将DataFrame的每一行迭代为元祖，可以通过row[name]对元素进行访问，比iterrows()效率高。
iteritems():按列遍历，将DataFrame的每一列迭代为(列名, Series)对，可以通过row[index]对元素进行访问。 
inp = [{'c1':10, 'c2':100}, {'c1':11, 'c2':110}, {'c1':12, 'c2':123}]
df = pd.DataFrame(inp)
1、按行 iterrows()
 
row[‘name’] 
for index, row in df.iterrows():
    print(index, row['c1'], row['c2'])
0 10 100
1 11 110
2 12 123
2、按行 itertuples()
 
getattr(row, ‘name’) 
for row in df.itertuples():
    print(getattr(row, 'c1'), getattr(row, 'c2'))
10 100
11 110
12 123
3、按列 iteritems()
 
row[index] 
for index, row in df.iteritems():
    print(index, row[0], row[1], row[2])
c1 10 11 12
c2 100 110 123
https://blog.csdn.net/sinat_29675423/article/details/87972498 
DataFrame的索引
 
pandas提供了专门的用于索引DataFrame的方法，如果要是用标签，最好使用loc方法，如果使用下标，最好使用iloc方法：
  
基础知识总结
 https://www.jianshu.com/p/8024ceef4fe2

                    初始化空的DataFrameimport pandas as pdempty_df = pd.DataFrame(columns=['A','B','C','D'])创建了四列，每一列的内容都是空的展示数据规模1、行数和列数df.shape2、按某一列名统计数据df.groupby('column_name').count()DataFrame数据拼接合并pd.merge()a=pd.DataFrame({'a':[1,2,3],'b':[2,3,4]})b=pd.Data
				Python零基础速成班，适用于入门或初级学习人群，采用Jupyter Notebook原装教程，.ipynb格式拷贝到Jupyter Notebook目录下即可运行，网页交互式可视化Python编程，全中文注解，下载即用，对初学者非常友好，也可作为Python程序员基础知识的补充再学习材料。
本教程由专业老师设计，由浅入深，带你扎实学习Python知识，附带的课后练习题精心设计，作为学习后知识的巩固和提升。
本教程设置3级标题，对知识点进行分类，内容上由基础+进阶的方式呈现，练习题也设置了必做和挑战项目，分别适用于初学者和进阶学习者。
整个教程大概有80个学时，同时也引入图像识别基础、算法基础、小游戏、爬虫、API设计基础、Excel文档操作、Numpy、Pandas、Matplotlib画图、数据库基础、网页WEB编程和Flask框架基础等，完成后将达到初级Python程序员水平。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(12).reshape(3,4),columns = list('甲乙丙丁'),
                  index = ["one","two","three"])
2.查看行索引，列索引
df.index
df.columns
3.增加、删除列
import pandas as pd
impor
				文章目录一.简介二.创建三.操作1.查看
DataFrame是一个二维的表格型结构，可以视为Series的容器，规定每一列所有元素的数据类型必须相同，不同列的元素数据类型可以不同
DataFrame有行索引和列索引，分别可以用index和columns进行查看
库的导入：
import  numpy as np
import pandas as pd 
利用DataFrame函数进行创建
参数可以为：
①python字典型
dict={
    "时间":pd.date_range("
属性和数据
DataFrame.axes                                #index: 行标签；columns: 列标签
DataFrame.as_matrix([columns])                #转换为矩阵
DataFrame.dtypes                              #返回数据的类型
DataFrame.f
		index: Optional[Axes]=None, # 行标
		columns: Optional[Axes]=None,  # 列标
		dtype: Optional[Dtype]=None,  # 存储的数据类型
		copy: bool=False)
我们可以直接创建空的dataframe，也可以在创造时就输入数据。
创建一个简单的dataframe：
import panda
				遍历 dataframe 可以使用 pandas 库提供的 iterrows() 方法。iterrows() 方法会返回一个包含每行数据的迭代器，每一行数据包含该行的索引和所有列的值，可以使用 for 循环遍历这个迭代器并处理每一行的数据。
例如，假设有一个名为 df 的 dataframe，可以按如下方式遍历每一行：
import pandas as pd
# 创建示例 dataframe
df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五'],
    '年龄': [20, 30, 40],
    '性别': ['男', '男', '女']
# 使用 iterrows() 方法遍历每一行
for index, row in df.iterrows():
    print(f'第 {index+1} 行数据：')
    print(f'姓名：{row["姓名"]}')
    print(f'年龄：{row["年龄"]}')
    print(f'性别：{row["性别"]}')
输出结果为：
第 1 行数据：
姓名：张三
年龄：20
第 2 行数据：
姓名：李四
年龄：30
第 3 行数据：
姓名：王五
年龄：40

推荐文章

谦虚好学的钥匙 · Java 遍历JsonNode
1 月前

另类的钢笔 · 光明乳业二期股权激励大扩容涉及210人_中国经济网��国家经济门户
7 月前

小眼睛的脆皮肠 · 无限接近真机环境的模拟器Genymotion蓝牙传感器WIFI_哔哩哔哩_bilibili
1 年前

闯红灯的墨镜 · jpg、png、svg、gif等图片格式的区别_svg和gif,png,gpeg,位圖與原圖的區別-CSDN博客
1 年前

稳重的李子 · 查看任务运行日志 - 任务 - Azure Container Registry | Microsoft Learn
1 年前

天涯 · DataX mysql与hive间传输数据_datax hive mysql-CSDN博客
2 年前