1、创建并访问Series对象。

1)创建如下表的Series数据对象,其中a-f为索引;

a

b

c

d

e

f

30

25

27

41

25

3

2)增加数据27,索引为g;

3)修改索引d对应的值为40;

4)查询值大于27的数据;

5)删除位置为1-3的数据。

【提示】位置1-3的索引列表,可以用 series.index[1:4] 来得到。

#1、创建并访问Series对象
from pandas import Series
S = Series([30,25,27,41,25,34],index = ['a','b','c','d','e','f'])
print(S)
#方法一:
S['g'] = 27
print(S)
#方法二:
A = Series([27],index = ['g'])
S = S.append(A)
print(S)
S['d'] = 40
print(S)
print(S[S.values>27])
print(S.drop(S.index[1:4]))  #或S.drop(['b','c','d'])

2.创建并访问DataFrame对象。

a)创建3×3DataFrame数据对象:数据内容为1-9;行索引为字符a,b,c;列索引为字符串one,two,three;

b)查询列索引为two和three两列数据;

c)查询第0行、第2行、第0列、第2列数据;

d)筛选第1列中值大于2的所有行数据,另存为data1对象;

e)为data1添加一列数据,列索引为four,值都为10;

f)将data1所有值大于9的数据修改为8;

g)删除data1中第0行和第1行数据。

(1)生成数据,使用numpy的arange()函数和reshape()函数;

(2)使用 data>9生成布尔型的DataFrame,用于整个DataFrame的数据过滤。

#2创建并访问DataFrame对象
from pandas import DataFrame
import numpy as np
df = DataFrame(np.arange(1,10).reshape(3,3),index = ['a','b','c'],columns = ['one','two','three'])
print(df)
print(df[['two','three']])
print(df.iloc[[0,2],[0,2]])
data1 = df.loc[df['two']>2]
print(data1)
data1['four'] = 10
print(data1)
data1[data1>9] = 8   #或者data1[data1.values>9] = 8
print(data1)
print(data1.drop(data1.index[0:2],axis = 0))
第3章【思考与练习2】创建并访问Series对象。创建如下表的Series数据对象,其中a-f为索引;增加数据27,索引为g。创建并访问DataFrame对象。创建3×3DataFrame数据对象。 第3章 | 数据汇总与统计。P44【思考与练习2】。3)修改索引对应的值为40;4)查询值大于27的数据;5)删除位置为1-3的数据。a)创建3×3DataFrame数据对象:数据内容为1-9;行索引为字符a,b,c;列索引为字符串one,two,three;b)查询列索引为two和three两列数据;c)查询第0行、第2行、第0列、第2列数据;d)筛选第1列中值大于2的所有行数据,另存为data1对象;e)为data1添加一列数据,列索引为four,值都为10; 3. 通过Numpy数组 创建 DataFrame DataFrame 这种列 式的 数据 结构和Excel工作 非常类似,其设计初衷是讲 Series 的使用场景由一维扩展到多维. DataFrame 由按一定顺序的多列 数据 组成,各列的 数据 类型可以有所不同(数值、字符串、布尔值). Series 对象 的Index数组存放有每个元素的标签,而 DataFrame 对象 有所不同,它有两个 索引 数组。第一个 索引 数组 acc”类在其属性中包含时间和 数据 信息,这些信息描述了加速度测量。 它是“时间序列”类的子类,因此可以直接应用“时间序列”类中的所有方法。 它还提供了一些过载的简单功能,例如FFT,绘图和带通滤波器,可直接用于分析机械冲击信号。 可以通过MATLAB命令窗口中的help acc 访问 help 一组处理机械冲击的加速时间历史信号的方法。 此类被写为'time series '类的子类,因此也可以使用所有'time series '方法。 acc属性: Sf-采样率时间-时间栏 数据 -实测加速度 数据 列长度-时间序列的长度 acc方法: acc-用于 创建 acc 对象 的构造方法。 resample1-重新采样时间序列。 带通-带通滤波器。 plot-
Series 结构,也称 Series 序列,是 Pandas 常用的 数据 结构之一,它是一种类似于一维数组的结构,由一组 数据 值(value)和一组标签组成,其中标签与 数据 值之间是一一对应的关系。 Series 可以保存任何 数据 类型,比如整数、字符串、浮点数、 Python 对象 等,它的标签默认为整数,从 0 开始依次递增。 创建 Series 对象 pd. Series ( data, index, dtype, copy) 输入的 数据 ,可以是列 、常量、ndarray
from deep series . models import Wave2Wave , RNN2RNN from deep series . train import Learner from deep series . data import Value , create_seq2seq_data_loader , forward_split from deep series . nn import RMSE , MSE import deep series . functional as F import numpy as np import torch batch_size = 16 enc_len = 36 dec_len = 12 series _len = 1000 第3章【综合练习题】根据某系的实验教学计划,完成以下分析:读取DataScience.xlsx文件数据,创建为DataFrame数据对象。根据银行储户的基本信息,完成以下分析。从文件中读取信息 第3章【思考与练习2】创建并访问Series对象。创建如下表的Series数据对象,其中a-f为索引;增加数据27,索引为g。创建并访问DataFrame对象。创建3×3DataFrame数据对象。 第4章【思考与练习2】数据文件high-speed rail.csv存放着世界各国高速铁路的情况。对世界各国高铁的数据进行绘图分析。使用Basemap绘制地图及使用Pyecharts绘制地图。 第3章【思考与练习2】创建并访问Series对象。创建如下表的Series数据对象,其中a-f为索引;增加数据27,索引为g。创建并访问DataFrame对象。创建3×3DataFrame数据对象。 m0_74792308: 为什么1.(5)是用index 啊 [1:4]明明是位置选取 第6章【思考与练习1】调整MLP分类器的参数solver,比较不同参数的模型在鸢尾花数据集上的分类性能。在MLP训练函数fit()前后增加计时功能,设置不同隐藏层数目,比较训练所耗费的时间。 第5章【思考与练习2】将数据集划分为训练集与测试集,查看决策树分类器的性能。 将例5-3中的分类器保存到文件中,然后重新加载预测给出的新数据。 第5章【思考与练习1】 延续回归模型的性能评估,计算使用全部数据学习得到的回归模型linreg在测试集上的性能。从例5-2训练集中取出前100条、200条样本,学习得到回归模型,并在测试集上预测分析