本博客主要聚焦于人工智能(Artificial Intelligence)领域,包括机器学习(Machine Learning)和深度学习(Deep Learning)以及其在具体项目中的实现,如:计算机视觉(Computer Vision, CV)、自然语言处理(Natural Language Processing, NLP)、知识图谱(Knowledge Graph, KG)、推荐系统(Recommender System)、因果推断(Causal Inference)等。除此之外,本博客还兼顾算法学(Algorithmics)、大数据(Big Data)与数据科学(Data Science)等方向的知识,冀希读者能能通过阅读本博客的文章,构建完整的知识体系与框架。博主撰写博文中的绝大多数都并非是博主本人的研究成果,大多是博主从书本、网站等公开资料学习并根据自身的项目经历总结而成,
本博客主要的参考文献列举在本文的文末
,若您觉得本博客中的文章涉嫌侵权,请直接私信联系修改内容或删除。
《
大数据与数据科学
》系列聚焦于数据分析领域,介绍了除机器学习算法以外的数据科学相关技术。除此之外,还系统介绍了Hadoop及其生态如Spark、Kylin等的相关知识以及这些框架在商业智能中的应用,如:维度建模、数据仓库等知识,这些内容与其它系列文章互补,构建了从数据模型到具体业务的知识体系。在数据获取层面,《
Python爬虫从入门到精通
》系列详细介绍了基于Python3的爬虫技术与方法。
本博客还对人工智能领域常用编程语言Python(《
系统学习Python
》系列)、Scala(《
快速入门Scala
》系列)做了详细介绍,无论是初学、进阶还是作为常用手册的查询,这两个系列的内容都非常合适。同时,《
人工智能与大数据面试指南
》系列汇总了本博客所有涉及的行业与应用场景,为读者总结了相应应用场景下常见的面试问题与其解答。
各分类的目录与介绍如下,我会根据实际情况逐渐完善各个分类下的内容。
《
人工智能与大数据面试指南
》系列汇总了本博客所有涉及的行业与应用场景,如:机器学习、深度学习、大数据、算法与数据结构、自然语言处理、计算机视觉、知识图谱、推荐系统等各领域的内容,为读者总结了相应应用场景下常见的面试问题与其解答。本系列下的内容会持续更新,有需要的读者可以收藏文章,以及时获取文章的最新内容。
本博客主要参考的书籍及资料:
[1] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015.
[2] Aston Zhang, Zack C. Lipton, Mu Li, Alex J. Smola. Dive Into Deep Learning[J]. arXiv preprint arXiv:2106.11342, 2021.
[3] James G , D Witten, Hastie T , et al. An Introduction to Statistical Learning: With Applications in R[M]. 2013.
[4] Albert King. AKShare. GitHub, 2019.
[5] ThomasH.Cormen, Cormen, Leiserson,等. 算法导论[M]. 机械工业出版社, 2006.
[6] Mark Lutz. Python学习手册[M]. 机械工业出版社, 2018.
[7] 周志华. 机器学习[M]. 清华大学出版社, 2016.
[8] 崔庆才. Python 3网络爬虫开发实战(第二版)[M]. 人民邮电出版社, 2021.
[9] 吴茂贵, 王红星. 深入浅出Embedding:原理解析与应用实战[M]. 机械工业出版社, 2021.
[10] 王喆. 深度学习推荐系统[M]. 电子工业出版社, 2020.
[11] 于化龙.类别不平衡学习:理论与算法[M].清华大学出版社, 2017.
[12] Storm, 李鲲程, 边宇明.Python实现Web UI自动化测试实战[M]. 人民邮电出版社, 2021.
[13] 陈华钧.知识图谱导论[M].电子工业出版社, 2021.
[14] 邵浩, 张凯, 李方圆, 张云柯, 戴锡强. 从零构建知识图谱[M].机械工业出版社, 2021.
[15] Thomas H. Cormen 等, 殷建平. 算法导论[M]. 机械工业出版社, 2013.
[16] Pang-NingTan, MichaelSteinbach, VipinKumar. 数据挖掘导论[M]. 人民邮电出版社, 2010.
决策树(Decision Tree)是一种基本的分类与回归方法。本文会讨论决策树中的分类树与回归树,后续文章会继续讨论决策树的Boosting和Bagging的相关方法。决策树由结点和有向边组成。结点有两种类型:内部结点和叶结点,其中内部结点表示一个特征或属性,叶结点表示一个类。
分类树是一种描述对实例进行分类的树形结构。
用决策树分类,从根结点开始,对实例的某一特征进行测试,根据测...
机器
学
习
算法
是一种能够从数据中
学
习的
算法
。卡耐基梅隆大
学
计算机科
学
学
院机器
学
习系主任Mitchell给出了机器
学
习
算法
的定义:对于某类任务TTT和性能度量PPP,一个计算机程序被认为可以从经验EEE中
学
习是指,通过经验EEE改进后,它在任务TTT上由性能度量PPP衡量的性能有所提升。
经验EEE,任务TTT和性能度量PPP的定义范围非常宽广,我们会在接下来的文章中提供直观的解释和示例来介绍不同的任务、性能度量和经验,这些将被用来构建机器
学
习
算法
。
任务TTT
机器
学
习可以让我们解决一些人为设计和使用确定性程
欧几里得距离或欧几里得度量是欧几里得空间中两点间的即直线距离。使用这个距离,欧氏空间成为度量空间,相关联的范数称为欧几里得范数。
nnn维空间中的欧几里得距离:
d(x,y)=∑i=1n(xi−yi)2=(x1−y1)2+(x2−y2)2+⋯+(xn−yn)2d(x, y)=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}=\sqrt{(x_1-y_1)^2+(x_2-y_2)^2+\cdots+(x_n-y_n)^2}d(x,y)=i=1∑n(xi−yi)2=(x1−y1)2+(x
markdown 生成带
目录
的文件安装用法1 、进入 markdown 文件所在的文件夹2 、进入 md 文件所在的文件夹后, 输入命令:
markdown 文件生成下面这种带侧边栏
目录
的 html 文件
npm install -g i5ting_toc
1 、进入 markdown 文件所在的文件夹
举个栗子:
你的sample.md文件放在桌面上
cd /Users/GJ...
本篇文章讲述为
博客
文章添加自动生成
目录
的功能。
讲述功能之前,我先说下我的
博客
文章从编写到发布展现给读者的大致过程。我的文章都是在本地用markdown语法编写的,待文章写完后,就直接从网站管理后台上传至服务器,这时读者就可以在我的网站看到我刚发布的文章了。当读者点击某一篇文章时,浏览器会发送一个请求,请求这篇文章获得文章的信息(包括markdown内容),请求成功后,markdown会被转换成html格式(这个转换我用的是Showdown.js库完成的),有了html代码,就可以直接在
1 C++ vector 删除和排序的相关函数
https://blog.csdn.net/boysoft2002/article/details/112895584
2 C++ <algorithm>Sort()函数秒杀任何常用排序
算法
https://blog.csdn.net/boysoft2002/article/details/113916668
3 Python tkinter库之Canvas 根据函数解析式或参数方程画出图像
https://blog.csdn.net/boysoft20...
本索引
目录
会一直不断进行更新…最近更新时间:2022.6.7 16:38物联网:2020后半段时间
学
习的javaweb
学
习笔记可见语雀(当时记录在那里就不搬过来了):语雀-Javaweb对应尚硅谷的Spring5
学
习笔记:语雀-框架/Spring5对应黑马SpringMVC教程
学
习笔记:语雀-框架/SpringMVC对应黑马SpringMVC教程
学
习笔记:语雀-框架/MybatisMyBatis插件:...................................................
本
博客
主要使用 系统化模式 来 编写
博客
,主要分为:
学
习能力体系、技术积累体系、管理知识体系
整个
博客
,主要是先建立起
学
习能力体系,借助
学
习能力体系 在 两个新的领域 技术 和管理 进行 践行。我是一个 思维导图和 思维模型 爱好者(通过TBCP 认证 和 导图等级考试Lv3),
博客
很多部分会使用思维导图 工具 和 思维模型做知识梳理。看
博客
的伙伴不必过于关注...