深度学习能够训练机器执行一些令人难以置信的任务,例如面部识别,癌症检测,甚至是股市预测。这就是为什么我们要学深度学习。
以下这些书可以让你从零开始学习深度学习。本文综述中的每一本书都有各自的优点,而且每一本书都非常出色。我已经把它们按我认为是最好的以及我建议学习先后的顺序排名。
1.用Scikit-Learn和TensorFlow进行机器学习
作者试图以一种几乎任何人都能理解的方式来解释复杂的话题,而且,你可以看到如何处理真实数据,如何将数据可视化以获取洞察力,以及重要的是如何为机器学习算法准备数据。
在本书后面,你将看到著名的MNIST分类器,模型是如何训练以及一些基本的机器学习分类器,如SVM,决策树,随机森林等。
所有这一切都是为了让你准备好本书的第二部分,内容涉及Tensorflow(包括安装)以及基本的神经网络和深度神经网络。
我认为这本书的结构很好,并以正确的顺序介绍了主题,而且书中的想法和具体例子都有很好的解释。
2.深度学习(Deep Learning)
这本书被许多人认为是深度学习的圣经,因为它汇集了数年和数年在一本书中学习和专注的研究。
这本书并不是为了专心学习,而是可以更好地用于睡前阅读,因为它充满了函数方程式,并以典型的教科书书写,所以它不会写成最有趣的风格。
它从一开始就介绍基础数学,如线性代数,概率论,接着转向机器学习基础,最后介绍深度网络和深度学习。
如果你是一个渴望掌握主题并进入深度学习研究的有抱负的学生,那么这本书肯定会对你有所帮助。这可能是目前关于此主题的最全面的书籍。
3.Deep Learning for the Layman(为外行准备的深度学习)
正如标题所说的的那样,它是为一般读者而写的。
对于外行的深度学习首先介绍深度学习,具体来说,它是什么以及为什么需要它。
本书的下一部分解释了监督学习,无监督学习和强化学习之间的差异,并介绍了分类和聚类等主题。本书后面将讨论人工神经网络,包括它们是如何构建的以及构成网络中每一层的部分。最后讨论了深度学习,包括构成当今许多计算机视觉算法的一部分的卷积神经网络。
如果你想要一本简单的英文指南,同时又能看到很少炒作的文字,那么这本书可能适合你。
4.建立你自己的神经网络(Make Your Own Neural Network)
这不是严格意义上的“深度学习”,但本书将带你深入了解神经网络及其工作原理,帮助你了解深度神经网络。
在本书中,你可以通过神经网络的数学指导,完整的理解神经网络的工作方式。你不仅可以知道他们如何工作,还可以在Python中实现两个神经网络示例,这将有助于巩固你对该主题的理解。
本书从机器学习的高层概述开始,然后深入研究神经网络的细节。所涉及的数学并没有超出大学水平,但包含微积分的介绍,这是以尽可能多的人访问的方式解释的。
5.深度学习初学者(Deep Learning for Beginners)
对于初学者的深度学习,这本书并不太重视深度学习的数学,而是使用图表来帮助你理解深度学习的基本概念和算法。
本书采用与许多其他书籍不同的方法,通过提供深度学习算法的工作原理的简单示例,然后逐步构建这些示例并逐步引入更复杂的算法部分。
就书本结构而言,你将首先学习人工神经网络的基础知识,并了解机器学习和深度学习之间的差异。之后,你将在进入卷积神经网络(CNN)和其他深度学习算法之前了解有关多层感知器(MLP)的所有信息。
这是一本很好的初学者书籍,可以很好地解释这些概念,但是如果你正在寻找更实用的东西,那么你应该在本综述中查找其他书籍。
6.神经网络和深度学习(Neural Networks and Deep Learning:Deep Learning explained to your granny)
一本通俗解释深度学习的书,简单地说,你的奶奶都可以在本书的帮助下理解深度学习!
神经网络和深度学习:让你逐步了解神经网络和深度学习的基础知识,对于那些想要了解这个主题但不一定想深入了解所有数学背景的人来说,这本书是一本很棒的书。
因此,在简要介绍机器学习之后,你将学习有监督学习和无监督的学习,然后研究诸如神经元、激活函数和不同类型的网络体系结构等。
最后,你将学习深度学习的实际工作原理,深度神经网络的主要类型(包括卷积神经网络),如何给神经网络提供记忆,还讨论了可用的各种框架和库。
7.深度学习基础:设计下一代机器智能算法(Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms)
Nikhil Buduma和Nicholas Locascio撰写的这本书以及旨在帮助你开始深度学习,但其目标是那些熟悉Python并具有微积分背景的人。
我认为这本书的亮点之一是它大量使用了Tensorflow,它是Google的深度学习框架,用于构建神经网络。事实上,书中有一整章专门介绍它,这在我看来是一个巨大的优势。
就本书的其余部分而言,它涉及一些相当先进的特性,如梯度下降、卷积滤波器、深度强化学习等等。
8.学习TensorFlow:构建深度学习系统的指南(Learning TensorFlow: A Guide to Building Deep Learning Systems)
接下来是一本完全关注Tensorflow的书,本书为Tensorflow提供了一个实用的实践方法,适用于广泛的技术人员,从数据科学家到工程师,学生。
通过在Tensorflow中提供一些基本示例,本书开始非常入门,但随后转向更深入的主题,如卷积神经网络等神经网络体系结构,如何使用文本和序列、TensorBoard可视化、TensorFlow抽象库以及多线程输入管道。
学习TensorFlow的终极目标是教你如何通过保存和导出模型以及如何使用Tensorflow服务API,在Tensorflow中构建和部署适用于生产的深度学习系统。
9.用Python深入学习(Deep Learning with Python)
深度学习with python作为标题建议介绍深度学习使用Python编程语言和开源Keras库,它允许简单快速的原型设计。
在Python深度学习中, 你将从一开始就学习深度学习,你将学习所有关于图像分类模型,如何使用深度学习获取文本和序列,甚至可以学习如何使用神经网络生成文本和图像。
本书是为那些具有Python技能的人员编写的,但你不必在机器学习,Tensorflow或Keras方面有过任何经验。你也不需要先进的数学背景,只有基础的高中水平数学应该让你跟随和理解核心思想。
10.深度学习:从业者的方法(Deep Learning :A Practitioner’s Approach)
本书重点介绍Deep Learning For Java(DL4J),它是用于训练和实施深度神经网络的Java框架/库。
现在大多数人工智能研究都是用Python进行的,因为快速原型开发通常更快,但随着更多组织(其中许多使用Java)拥抱AI,我们可能会看到更多的AI算法转向Java,如DL4J。
本书首先是关于深度学习的初学者书籍,但如果你已经具备Java或深度学习的经验,那么你可以直接查看示例。
通过阅读本书,你将总体了解机器学习概念,特别关注深度学习。你将了解深度神经网络是如何从基础神经网络发展而来的,你还将了解一些深层网络架构,如卷积神经网络和循环神经网络。
如果你熟悉Hadoop和Spark,那么你将能够了解如何使用DL4J本身的这些技术。
11.用TensorFlow进行专业深度学习(Pro Deep Learning with TensorFlow)
本书将以亲身实践的方式教给你Tensorflow,让你能够从零开始学习深度学习,快速掌握Tensorflow API并学习如何优化各种深度学习网络架构。
专业深度学习将帮助你开发调整现有神经网络体系结构所需的数学知识和经验,甚至创造出可能挑战最新技术水平的全新体系结构。
本书中的所有代码都以iPython笔记本的形式提供,因为我过去曾使用过Tensorflow,我发现在开发过程中使用iPython笔记本电脑非常有用。
本书面向数据科学家和机器学习专业人员、软件开发人员、研究生和开源爱好者,并将为你提供数学基础和机器学习原理,使你能够开展研究并将深度学习解决方案部署到生产环境中。
12.用于深度学习的TensorFlow(TensorFlow for Deep Learning)
本书将通过从头开始的实例向你介绍深度学习的概念,专门为开发经验丰富的构建软件系统的开发人员但没有深度学习体系结构的经验设计。
本书将向你展示如何设计可执行对象检测,翻译人类语言,分析视频甚至预测潜在药物特性的系统!
你将获得关于Tensorflow API的深入知识,如何在大型数据集上训练神经网络以及如何在卷积网络,循环网络,LSTM和强化学习中使用TensorFlow。
本书的确需要一些基本线性代数和微积分的背景知识,但这是一本实用的书,旨在教你如何创建可以学习的系统。
人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,有兴趣的朋友,可以查阅多智时代,在此为你推荐几篇优质好文:
-
优化深度学习的计算,主要面临哪几大挑战?
-
深度学习、机器学习与NLP,为什么要学习这些新技术
-
深度学习与数据中心之间的关系
深度学习能够训练机器执行一些令人难以置信的任务,例如面部识别,癌症检测,甚至是股市预测。这就是为什么我们要学深度学习。以下这些书可以让你从零开始学习深度学习。本文综述中的每一本书都有各自的优点,而且每一本书都非常出色。我已经把它们按我认为是最好的以及我建议学习先后的顺序排名。1.用Scikit-Learn和TensorFlow进行机器学习作者试图以一种几乎任何人都能理解的方式来解释...
神经网络是一个具有相互连接的节点的计算系统,其节点的工作方式更像是人脑中的神经元。这些神经元在它们之间
进行
处理并传递信息。每个神经网络都是一系列的算法,这些算法试图通过一个模拟人类大脑运作的过程来识别一组数据中的潜在关系。
深度
学习
算法和经典神经网络之间有什么区别呢?最明显的区别是:深度
学习
中使用的神经网络具有更多隐藏层。这些层位于神经元的第一层(即输入层)和最后一层(即输出层)之间。另外,没有必要将不同层的所有神经元连接起来。
您应该知道的9种深度
学习
算法
#1反向传播
反向传播算法是一种非常流行的用于
《人工智能:深度
学习
入门到精通实战》课程主要就人工智能领域相关的深度
学习
基础、深度
学习
计算、卷积神经网络+经典网络、循环神经网络+RNN进阶、优化算法、计算机视觉和自然语言处理等,配套实战案例与项目全部基于真实数据集与实际任务展开,结合深度
学习
框架
进行
建模实战。 由浅入深,每一个理论搭配一个实验,引领学员浸泡式逐步掌握各项技能和实战项目,且侧重技能不同,学员的知识体系会更加全面课程大纲:第一章:深度
学习
基础-深度
学习
简介01.1-前置知识01.2-传统编程与数据编程01.3-深度
学习
起源01.4-深度
学习
崛起与发展01.5-深度
学习
成功案例01.6-深度
学习
特点 第二章:深度
学习
基础-Python基础02.1-PyTorch介绍与环境配置02.2-数据操作与创建Tensor02.3-算术操作、索引与改变形状02.4-线性代数、广播机制与内存开销02.5-Tensor和NumPy相互转换与Tensor on GPU02.6-实验01-创建和使用Tensor-102.7-实验01-创建和使用Tensor-202.8-梯度下降02.9-实验02-梯度下降-102.10-实验02-梯度下降-202.11-自动求梯度概念02.12-自动求梯度实例02.13-实验03-自动求梯度-102.14-实验03-自动求梯度-2 第三章:深度
学习
基础-线性回归03.1-线性回归讲解03.2-线性回归实例03.3-实验04-从零实现线性回归-103.4-实验04-从零实现线性回归-203.5-实验05-线性回归的简洁实现-103.6-实验05-线性回归的简洁实现-2 第四章:深度
学习
基础-softmax回归04.1-softmax回归04.2-实验06-FashionMNIST04.3-实验07-从零实现Softmax回归-104.4-实验07-从零实现Softmax回归-204.5-实验08-softmax回归的简洁实现 第五章:深度
学习
基础-多层感知机05.1-感知机05.2-多层感知机05.3-多层感知机与神经网络05.4-激活函数05.5-正向传播05.6-反向传播05.7-正向传播和反向传播05.8-批大小05.9-实验09-从零实现MLP05.10-实验10-MLP的简洁实现 第六章:深度
学习
基础-模型选择、欠拟合和过拟合06.1-训练误差和泛化误差06.2-模型选择06.3-欠拟合和过拟合06.4-权重衰减06.5-丢弃法06.6-实验11-多项式函数拟合实验06.7-实验12-高维线性回归实验-106.8-实验12-高维线性回归实验-206.9-实验13-Dropout 第七章:深度
学习
基础-数值稳定性和模型初始化07.1-数值稳定性和模型初始化-107.2-数值稳定性和模型初始化-207.3-实验14-房价预测案例-107.4-实验14-房价预测案例-207.5-实验14-房价预测案例-3 第八章:深度
学习
计算-模型构造08.1-模型构造-108.2-模型构造-208.3-模型构造-308.4-实验15-模型构造-108.5-实验15-模型构造-2 第九章:深度
学习
计算-模型参数的访问、初始化和共享09.1-模型参数的访问09.2-模型参数初始化和共享09.3-实验16-模型参数-109.4-实验16-模型参数-2 第十章:深度
学习
计算-自定义层与读取和储存10.1-不含模型参数的自定义层10.2-含模型参数的自定义层10.3-实验17-自定义层10.4-读取和储存10.5-GPU计算10.6-实验18-读取和储存 第十一章:卷积神经网络11.01-卷积神经网络11.02-卷积神经网络的组成层11.03-图像分类的局限性11.04-二维卷积层与卷积层11.05-卷积在图像中的直观作用11.06-实验19-二维卷积层11.07-填充与步幅11.08-卷积过程11.09-卷积层参数-111.10-卷积层参数-211.11-实验20-Pad和Stride11.12-多输入和输出通道11.13-实验21-多通道11.14-池化层11.15-实验22-池化层 第十二章:经典网络12.01-卷积神经网络12.02-实验23-LeNet模型12.03-深度卷积神经网络12.04-实验24-AlexNet模型12.05-使用重复元素的网络12.06-实验25-VGG模型12.07-网络中的网络12.08-实验26-NiN模型12.09-含并行连接的网络12.10-实验27-GoogLeNet模型12.11-批量归一化-112.12-批量归一化-212.13-实验28-批量归一化12.14-残差网络12.15-实验29-残差网络12.16-稠密连接网络12.17-实验30-稠密连接网络 第十三章:循环神经网络13.01-语言模型和计算13.02-n元语法13.03-RNN和RNNs13.04-标准RNN向前输出流程和语言模型应用13.05-vector-to-sequence结构13.06-实验31-语言模型数据集-113.07-实验31-语言模型数据集-213.08-实验32-从零实现循环神经网络-113.09-实验32-从零实现循环神经网络-213.10-实验32-从零实现循环神经网络-313.11-实验32-从零实现循环神经网络-413.12-实验33-简洁实现循环神经网络-113.13-实验33-简洁实现循环神经网络-2 第十四章:RNN进阶14.01-通过时间反向传播-114.02-通过时间反向传播-214.03-长短期记忆-114.04-长短期记忆-214.05-实验34-长短期记忆网络-114.06-实验34-长短期记忆网络-214.07-门控循环单元14.08-RNN扩展模型14.09-实验35-门控循环单元 第十五章:优化算法15.01-优化与深度
学习
15.02-局部最小值和鞍点15.03-提高深度
学习
的泛化能力15.04-实验36-小批量梯度下降-115.05-实验36-小批量梯度下降-215.06-动量法-115.07-动量法-215.08-实验37-动量法15.09-AdaGrad算法与特点15.10-实验38-AdaGrad算法15.11-RMSrop算法15.12-实验39-RMSProp算法15.13-AdaDelta算法15.14-实验40-AdaDelta算法15.15-Adam算法15.16-实验41-Adam算法15.17-不用二阶优化讲解与超参数 第十六章:计算机视觉16.01-图像增广与挑战16.02-翻转、裁剪、变化颜色与叠加16.03-实验42-图像增广-116.04-实验42-图像增广-216.05-微调16.06-迁移
学习
16.07-实验43-微调-116.08-实验43-微调-216.09-目标检测16.10-边界框16.11-实验44-边界框16.12-锚框与生成多个锚框16.13-交并比16.14-实验45-生成锚框-116.15-实验45-生成锚框-216.17-标注训练集的锚框-116.18-标注训练集的锚框-216.19-实验46-标注训练集的锚框-116.20-实验46-标注训练集的锚框-216.21-实验46-标注训练集的锚框-316.22-输出预测边界框16.23-实验47-输出预测边界框-116.24-实验47-输出预测边界框-216.25-多尺度目标检测16.26-实验48-多尺度目标检测16.27-目标检测算法分类16.28-SSD与模型设计16.29-预测层16.30-损失函数16.31-SSD预测16.32-实验49-目标检测数据集16.33-实验50-SSD目标检测-116.34-实验50-SSD目标检测-216.35-实验50-SSD目标检测-316.36-实验50-SSD目标检测-416.37-实验50-SSD目标检测-516.38-实验50-SSD目标检测-6 第十七章:自然语言处理17.01-词嵌入和词向量17.02-神经网络模型17.03-跳字模型17.04-训练跳字模型17.05-连续词袋模型17.06-负采样17.07-层序softmax17.08-子词嵌入17.09-Fasttext模型17.10-全局向量的词嵌入17.11-实验51-word2vec之数据预处理-117.12-实验51-word2vec之数据预处理-217.13-实验52-word2vec之负采样-117.14-实验52-word2vec之负采样-217.15-实验53-word2vec之模型构建-117.16-实验53-word2vec之模型构建-217.17-实验54-求近义词和类比词-117.18-实验54-求近义词和类比词-217.19-实验55-文本情感分类RNN-117.20-实验55-文本情感分类RNN-217.21-实验55-文本情感分类RNN-317.22-实验55-文本情感分类RNN-417.23-TextCNN17.24-TextCNN流程17.25-实验56-文本情感分类textCNN-117.26-实验56-文本情感分类textCNN-217.27-Seq2Seq的历史与网络架构17.28-Seq2Seq的应用与存在的问题17.29-Attention机制与Bucket机制17.30-实验57-机器翻译之模型构建-117.31-实验57-机器翻译之模型构建-217.32-实验57-机器翻译之模型构建-317.33-实验58-机器翻译之训练评估-117.34-实验58-机器翻译之训练评估-217.35-实验58-机器翻译之训练评估-3
Neural Networks,简称NN。可以使用线性回归y=Wx+b,
进行
理解。神经网络中的每一层都是在维护一个参数矩阵W和偏置向量b。模型,首先通过前向过程得到预测值,然后计算预测值与目标值之间的误差,最后将误差
进行
反向传播来更新每一层的W和b为更适合数据集样本的值。NN通过多个隐藏层叠加来
学习
更复杂的特征关系,如异或。
卷积神经网络
Convolutional Neural Networks, 简称CNN。针对NN是串行
学习
的问题,CNN将参数矩阵分为不同作用几个类别:卷积层Convol