“十四五” 全国统计规划教材
写在前面的话
今天小编跟大家分享一本刚刚上市新鲜出炉的重磅新书《Python数据分析基础》(第3版)。不同于市面上的大多数入门或者教授语法的Python书籍,该书是“
十四五”全国统计规划教材(其第2版为“十三五”全国统计规划教材,而且还被中国台湾五南图书出版公司引入繁体版权在港澳台地区发行)
。该书从统计和数据分析的视角出发,由浅入深、层层递进,帮助读者们建立起完整的数据分析思维方式,并get到数据分析和Python应用的能力。书中通过丰富的案例和详尽的解析,让原本晦涩艰深的编程语言学习和抽象的分析理论及方法变得更通俗易懂,无论是在一本正经的课堂学习,还是在茶余饭后的悠闲消遣,都是一本非常值得pick的书籍。
数据来源:IEEE 2022
如上图,势不可挡的Python已经成为世界上最受欢迎的编程语言;摩根大通发表评论说不懂编程就是文盲🤦🏻♀️!Python之父Guido van Rossum说“人生苦短,我用Python”!那么该如何玩转风靡全宇宙的Python呢?不用等了,
《Python数据分析基础》(第3版)干货满满的600页(比第2版多了100页,只贵了1块钱!)
,直接了当给你全部答案!
全书通过真实案例,全面介绍 Python 3 编程基础及其数据分析工具的应用,培养读者 通过数据分析问题、解决问题以及对结果评价的能力。
内容包括:Python 3 基本配置和编程基础、编程进阶、数据预处理、数据描述与数据探索、绘图与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、神经网络和深度学习、时间序列分析、信号滤波等,将读者关注的基本数据分析方法进行剖析。
《Python数据分析基础》(第3版)
中国统计出版社,2022年8月
本版(第3版)
修订内容
本书第2版于2018年出版之后,被北京大学等全国百余所高等院校采纳为教材,同时被中国台湾五南图书出版有限公司引进繁体中文版权在港澳台地区发行,得到了广泛的使用。
4年来,在充分吸收各院校授课教师和学生的教学反馈以及业界人士实践检验的基础上,第3版对全书内容进行了进一步全面而彻底地更新,修订的主要内容如下:
全书基于Python 3.10.4对全部内容进行了彻底更新,增加了Python最新的语法特性,删除了老旧版本的内容。
第1章重新系统地组织了内容体系,增加了Python在不同操作系统中安装、配置、内核更新、寻址与寻值等的详细介绍,增加了语法糖、魔术命令、嵌套生成器等高级特性的介绍,增加了正则表达式的详细内容;
第2章增加了魔法方法、日志系统和GPU加速计算的内容;
第3章增加了面板数据与层次化索引的内容;
第4章增加了使用标准库statistics进行统计分析的内容;
第5章增加了绘制玫瑰图的内容,并将该章名称修改为“绘图与可视化”;
第9章增加了使用第三方工具库mlxtend、pyfpgrowth进行关联分析的内容;
第12章增加了使用statsmodels提供的类multivariate.pca.PCA来进行主成分分析的具体内容;
第17章增加了信号处理和滤波的内容,并将该章名称修改为“时间序列与信号滤波”;
提供
免费的配套在线平台
供读者使用。
读者可在学习平台中查看全书各章节的原始代码、数据以及课件,并在线运行本书提供的程序,扫码注册或登录系统即可使用(码在书中)。
本书既可作为高等院校数据科学与大数据技术、大数据管理与应用、人工智能、统计学及其相关专业的本科生和研究生教材,也可作为社会科学领域数据分析的自学教材,同时还可以作为从事数据分析与数据管理工作的参考用书,也适合想用Python来解决实际数据分析问题的工程技术和管理人员。
阮敬
,
博士、教授、博士生导师。现任首都经济贸易大学数据科学学院副院长,兼任第七届全国统计教材编审委员会学术委员、数据科学与大数据应用组副组长,中国现场统计研究会副秘书长、经济与金融统计分会副理事长,中国统计教育学会副秘书长、高等教育分会秘书长,全国工业统计学教学研究会常务理事、青年统计学家协会创始秘书长,北京大数据协会副会长、秘书长,《统计学报》《统计与精算》编委等。在国内外发表论文70余篇,出版专著、译著、教材16本,主持国家级和省部级项目及各级政府与企事业单位课题50余项,先后10余次荣获省部级及以上科研和教学奖励。
刘帅,
博士,北京工商大学数学与统计学院讲师,兼任北京大数据协会副秘书长、理事。有多年丰富的国内外数据行业从业经历,主要从事大数据分析与数据自动化相关研究工作。
“十四五” 全国统计规划教材出版前言
教材之于教育,如行水之舟楫。统计教材建设是统计教育事业的重要基础工程,是统计教育的重要载体,起着传授统计知识、培育统计理念、涵养统计思维、指导统计实践的重要作用。
全国统计教材编审委员会(以下简称编委会)成立于1988年,是国家统计局领导下的全国统计教材建设工作的最高指导机构和咨询机构,承担着为建设中国统计教育大厦打桩架梁、布设龙骨的光荣而神圣的职责与使命。自编委会成立以来,共组织编写和出版了“七五”至“十三五”七轮全国统计规划教材,这些规划教材被全国各院校师生广泛使用,对中国统计教育事业作出了积极贡献。
党的十九届五中全会审议通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二○三五年远景目标的建议》,为推进统计现代化改革指明了方向,提供了重要遵循。实现统计现代化,首先要提升统计专业素养,包括统计知识、统计观念和统计技能等方面要适应统计现代化建设需要,从而提出了统计教育和统计教材建设现代化的新任务新课题。编委会深入学习贯彻党的十九届五中全会精神,准确理解其精神内涵,围绕国家重大现实问题、基础问题和长远问题,加强顶层设计,扎实推进“十四五”全国统计规划教材建设。本轮规划教材组织编写和出版中重点把握以下方向:
1.面向高等教育、职业教育、继续教育分层次着力打造全系列、成体系的统计教材优秀品牌。2.围绕统计教育事业新特点,组织编写适应新时代特色的高质量高水平的优秀统计规划教材。3.积极利用数据科学和互联网发展成果,推进统计教育教材融媒体发展,实现统计规划教材的立体化建设。4.组织优秀统计教材的版权引进和输出工作,推动编委会工作迈上新台阶。5.积极组织规划教材的编写、审查、修订、宣传评介和推广使用。“十四五”期间,本着植根统计、服务统计的理念,编委会将不忘初心,牢记使命,充分利用优质资源,继续集中优势资源,大力支持统计教材发展,进一步推动统计教育、统计教学、统计教材建设,进一步加强理论联系实际,有序有效形成合力,继续创新性开展统计教材特别是规划教材的编写研究,为培养新一代统计人才献智献策、尽心尽力。同时,编委会也诚邀广大统计专家学者和读者参与本轮规划教材的编写和评审,认真听取统计专家学者和读者的建议,组织编写出版好规划教材,使规划教材能够在以往的基础上,百尺竿头,更进一步,为我国统计教育事业作出更大贡献。
国家统计局
全国统计教材编审委员会
2021年9月
点此查看目录
第 1 章 Python 编程基础 …… 1
1.1 Python 系统配置
1.1.1 在 macOS 和 Windows 系统中安装 Python
1.1.2 在 Linux 系统中安装 Python
1.1.3 使用Jupyter Notebook
1.1.4 内核升级
1.1.5 本书约定
1.2 Python 基础知识
1.2.1 帮助
1.2.2 标识符
1.2.3 行与缩进
1.2.4 对象
1.2.5 数字与表达式
1.2.6 运算符
1.2.7 字符串
1.2.8 日期和时间
1.2.9 语法糖
1.2.10 魔术命令
1.3 数据结构与序列
1.3.1 列表
1.3.2 元组
1.3.3 字典
1.3.4 集合
1.3.5 推导式
1.4 语句与控制流
1.4.1 条件语句
1.4.2 循环语句
1.5 函数
1.5.1 函数的参数
1.5.2 对象的作用域
1.5.3 匿名函数
1.5.4 递归
1.5.5 闭包
1.5.6 柯里化与反柯里化
1.5.7 常用的内置高阶函数
1.6 迭代器、生成器和装饰器
1.6.1 迭代器
1.6.2 生成器
1.6.3 装饰器
1.7 正则表达式
1.7.1 正则表达式语法
1.7.2 re 模块
第 2 章 Python 编程进阶 ……63
2.1 类
2.1.1 声明类
2.1.2 方法
2.1.3 属性
2.1.4 继承
2.1.5 特性
2.2 异常捕获与容错处理
2.2.1 错误和异常
2.2.2 异常处理
2.3 模块
2.4 包
2.4.1 包的组成与调用
2.4.2 常用数据分析工具库
2.5 文件 I/O
2.6 多核并行计算
2.6.1 串行
2.6.2 多进程
2.7 GPU 计算
2.7.1 GPU 的特点
2.7.2 CuPy GPU 加速
2.7.3 Numba GPU 加速
2.7.4 PyTorch GPU 加速
2.8 日志系统
2.8.1 logging 模块
2.8.2 输出日志到终端
2.8.3 输出日志到文件
2.8.4 日志分级
2.8.5 日志格式
第 3 章 数据预处理与数据探索 ……117
3.1 NumPy 基础
3.1.1 向量
3.1.2 数组
3.1.3 矩阵
3.1.4 文件读写
3.2 pandas 基础
3.2.1 pandas 的基础数据结构
3.2.2 pandas 的基本操作
3.2.3 时间序列
3.2.4 面板数据与层次化索引
3.2.5 缺失值处理
第 4 章 数据描述 …… 189
4.1 统计量
4.1.1 集中趋势
4.1.2 离散程度
4.1.3 分布形状
4.1.4 常用统计量及其计算函数或方法
4.2 统计表
4.2.1 统计表的基本要素
4.2.2 统计表的编制
第 5 章 绘图与可视化 …… 206
5.1 matplotlib 基本绘图
5.1.1 函数绘图
5.1.2 图形基本设置
5.1.3 面向对象绘图
5.1.4 绘图样式
5.2 pandas 基本绘图
5.3 基本统计图形
5.3.1 折线图
5.3.2 面积图
5.3.3 直方图
5.3.4 条形图
5.3.5 龙卷风图
5.3.6 饼图
5.3.7 阶梯图
5.3.8 盒须图
5.3.9 小提琴图
5.3.10 散点图
5.3.11 气泡图
5.3.12 六边形箱图
5.3.13 雷达坐标图
5.3.14 轮廓图
5.3.15 调和曲线图
5.3.16 等高线图
5.3.17 极坐标图与玫瑰图
5.3.18 词云图
5.3.19 数据地图
5.4 其他绘图工具
第 6 章 简单统计推断 …… 251
6.1 简单统计推断的基本原理
6.1.1 数据分布
6.1.2 参数估计
6.1.3 假设检验
6.2 单总体参数的估计及假设检验
6.2.1 单总体的参数估计
6.2.2 单总体参数的假设检验
6.3 两总体参数的假设检验
6.3.1 独立样本的假设检验
6.3.2 成对样本的假设检验
第 7 章 方差分析 ……272
7.1 方差分析的基本原理
7.2 一元方差分析
7.2.1 一元单因素方差分析
7.2.2 一元多因素方差分析
7.3 协方差分析
第 8 章 非参数检验 …… 291
8.1 非参数检验的基本问题
8.2 单样本非参数检验
8.2.1 中位数(均值)的检验
8.2.2 分布的检验
8.2.3 游程检验
8.3 两个样本的非参数检验
8.3.1 独立样本中位数比较的 Wilcoxon 秩和检验
8.3.2 独立样本的分布检验
8.3.3 成对(匹配)样本中位数的检验
8.3.4 两样本的游程检验
8.4 多个样本的非参数检验
8.4.1 多个样本的分布检验
8.4.2 独立样本位置的检验
第 9 章 相关分析与关联分析 …… 305
9.1 相关分析
9.1.1 函数关系与相关关系
9.1.2 简单相关分析
9.1.3 偏相关分析
9.1.4 点二列相关分析
9.1.5 非参数相关分析
9.2 关联分析
9.2.1 基本概念与数据预处理
9.2.2 Apriori 算法
9.2.3 FP-growth 算法
第 10 章 回归分析 …… 324
10.1 线性回归
10.1.1 回归分析的基本原理
10.1.2 一元线性回归
10.1.3 多元线性回归
10.1.4 含有定性自变量的线性回归
10.2 非线性回归
10.2.1 可线性化的非线性分析
10.2.2 非线性回归模型
10.3 多项式回归
10.4 分位数回归
第 11 章 离散因变量模型 …… 361
11.1 线性概率模型
11.2 二元选择模型
11.2.1 线性概率模型的缺陷与改进
11.2.2 二元选择模型的基本原理
11.2.3 二元 Probit 模型
11.2.4 二元 Logit 模型
11.3 多重选择模型
11.4 计数模型
第 12 章 主成分与因子分析 …… 379
12.1 数据降维
12.1.1 数据降维的基本问题
12.1.2 数据降维的基本原理
12.2 主成分分析
12.2.1 主成分分析的基本概念与原理
12.2.2 主成分分析的基本步骤和过程
12.3 因子分析
12.3.1 因子分析的基本原理
12.3.2 因子分析的基本步骤和过程
第 13 章 列联分析与对应分析 …… 407
13.1 列联分析
13.1.1 列联表
13.1.2 列联表的分布
13.1.3 χ2 分布与χ2 检验
13.1.4 χ2 分布的期望值准则
13.2 对应分析
13.2.1 对应分析的基本思想
13.2.2 对应分析的步骤和过程
第 14 章 聚类 …… 428
14.1 聚类的基本原理
14.1.1 聚类的基本原则
14.1.2 单一指标的系统聚类过程
14.1.3 多指标的系统聚类过程
14.2 聚类的步骤和过程
14.2.1 系统聚类
14.2.2 K-MEANS 聚类
14.2.3 DBSCAN 聚类
第 15 章 判别和分类 …… 446
15.1 判别和分类的基本思想
15.1.1 判别
15.1.2 分类
15.1.3 效果评估
15.2 常用判别方法和分类算法
15.2.1 距离判别和线性判别
15.2.2 贝叶斯判别
15.2.3 k-近邻
15.2.4 决策树
15.2.5 随机森林
15.2.6 支持向量机
第 16 章 神经网络与深度学习 …… 470
16.1 神经网络
16.1.1 基本概念与原理
16.1.2 感知机
16.1.3 多层神经网络
16.2 深度学习
16.2.1 基本概念与原理
16.2.2 卷积神经网络
16.2.3 TensorFlow
16.2.4 PyTorch
16.3 应用场景与工具
16.3.2 目标检测
第 17 章 时间序列与信号滤波 …… 522
17.1 时间序列的基本问题
17.1.1 时间序列的组成部分
17.1.2 时间序列的平稳性
17.2 ARIMA 模型的分析过程
17.2.1 ARIMA 模型
17.3 信号滤波
17.3.1 平滑滤波
17.3.2 导数滤波
附录:各章图形(部分) …… 544
-The end-
✬如果你喜欢这篇文章,欢迎分享到朋友圈✬
评论功能现已开启,我们接受一切形式的吐槽和赞美☺
返回搜狐,查看更多
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
发布于:
北京市