相关文章推荐
痛苦的红金鱼  ·  海淀70所公办初中登记入学招生计划出炉,9校 ...·  1 年前    · 
不敢表白的斑马  ·  《关于支持企业建立研发机构促进企业加大全社会 ...·  1 年前    · 
完美的双杠  ·  升学漫谈 | 令人心动的offer(四) ...·  1 年前    · 
鬼畜的水龙头  ·  MECT需要多少钱? - 知乎·  2 年前    · 
安静的回锅肉  ·  【心编丛荐】困在心绪里的儿子_中国劳动关系学 ...·  2 年前    · 
Code  ›  机器如何学习?5分钟弄懂监督学习、无监督学习、半监督学习与强化学习开发者社区
机器学习 神经网络算法 强化学习 无监督学习
https://cloud.tencent.com/developer/article/1109153
爱看书的竹笋
2 年前
作者头像
AI科技大本营
0 篇文章

机器如何学习?5分钟弄懂监督学习、无监督学习、半监督学习与强化学习

前往专栏
腾讯云
备案 控制台
开发者社区
学习
实践
活动
专区
工具
TVP
文章/答案/技术大牛
写文章
社区首页 > 专栏 > AI科技大本营的专栏 > 正文

机器如何学习?5分钟弄懂监督学习、无监督学习、半监督学习与强化学习

发布 于 2018-04-26 10:22:04
1.7K 0
举报
导读:不知道你有没有这样的感受,想学点人工智能,却被一大堆名词吓坏? 想看点直白的说人话的简单介绍,却被各种绕来绕去的语言弄昏头? 没关系,本文就试图以最简单的语言,给你普及一下我们通常所说的人工智能的四种方法,并通过有趣的例子,帮你建立一些直观的感受,而且很容易读懂,是一篇机器学习入门的不可多得的好文章。 同时,文章还包括相关的很多文章和论文,是个很不错的资源包。请在微信对话中回复“ 机器学习 ”即可获得本文涉及的论文资源包。 好了,5分钟时间,轻松学习到底什么是监督学习,无监督学习,半监督学习,以及强化学习,enjoy!

作者 | Frank Chen

翻译 | 智子

整理 | AI100(ID:rgznai100)

读懂机器学习的四大方法

根据训练方法的不同,机器学习可以分为四类:

  • 监督学习
  • 无监督学习
  • 半监督学习
  • 强化学习

本文会对各种学习方法给出一种非常直观的解释。

文中,我们也会为你介绍那些经常在论文中出现的名词术语,还会给出不同的机器学习方法所对应的学习资源。

总的来说,本文的分类方法,既适用于传统的机器学习,又适用于新出现的深度学习。

对于数学相关的问题,可以看看 斯坦福大学的深度学习教程 ,它涵盖了监督学习和无监督学习,且附有代码实例。

斯坦福大学的深度学习教程(吴恩达等人撰写) http://ufldl.stanford.edu/tutorial/

▍监督学习

监督学习是用正确答案已知的例子来训练神经网络,也就是用标记过的数据。如果我们想设计一个系统——从相册中找出包含你的父母的照片,基本的步骤如下:

第一步:数据的生成和分类

首先,需要将你所有的照片看一遍,记录下来哪些照片上有你的父母。然后把照片分为两组。第一组叫做训练集,用来训练神经网络。第二组叫做验证集,用来检验训练好的神经网络能否认出你的父母,正确率有多少。

之后,这些数据会作为神经网络的输入,得到一些输出。用数学语言表示就是:找到一个函数,该函数的输入是一幅照片。当照片上有你的父母的时候,输出为1;没有的时候,输出为0。

这种问题通常叫做分类。因为这个例子中,输出只有两个可能,是或者不是。

当然,监督学习的输出也可以是任意值,而不仅仅是0或者1。举另一个例子,我们的神经网络可以预测一个人还信用卡的概率。这个概率可以是0到100的任意一个数字。这种问题通常叫做回归。

第二步:训练

在进行训练这一步时,每一幅图像都会作为神经网络的输入,根据一定的规则(激活函数),决定某个神经元的输出,进而得到某一层的输出。当计算完所有神经元的时候,最后得到了最右边的神经元(输出节点)的输出,是0还是1。

上一步中,我们已对照片上是否有你父母做过标记。这样,我们就能知道神经网络所预测的结果是否正确,并把这一信息反馈回神经网络。

这里所反馈的,是成本函数的计算结果,即神经网络计算结果与实际情况的偏差。这个函数也叫做目标函数、效用函数或者适应度函数。这一结果用来调整神经元的权重和偏差,这就是BP算法,即 反向传播算法 ,因为该信息是从后向前传递的。

刚才针对的是一个照片。你需要对每张照片不断重复这个过程。每个过程中都要最小化成本函数。

BP算法有很多实现方法,最常用还是梯度递减的方法。

Algobeans 非常通俗易懂的解释了这个方法。Michael Nielsen 在此基础上,加上了积分和线性代数,也给出了形象生动的演示。

神经网络入门 https://algobeans.com/2016/11/03/artificial-neural-networks-intro2/ 反向传播算法原理 http://neuralnetworksanddeeplearning.com/chap2.html

第三步:验证

至此,第一组中的数据已经全部用完。接下来我们会用第二组数据验证训练得到的模型的准确率。

优化模型的许多参数(超参)需要优化,因此导致第二步和第三步通常会交叉进行。常用的超参有神经网络有多少个神经元,有多少层神经元,哪个函数用来激活一个神经元(激活函数),用多快的速度来训练网络(学习速率)等等。 Quora 工程师主管的这一回复 很好的解释了这些超参。

Quora 工程师主管回复

 
推荐文章
痛苦的红金鱼  ·  海淀70所公办初中登记入学招生计划出炉,9校面向全区招生_手机新浪网
1 年前
不敢表白的斑马  ·  《关于支持企业建立研发机构促进企业加大全社会研发投入若干措施》政策解读新闻发布会_新闻发布会_海南省商务厅
1 年前
完美的双杠  ·  升学漫谈 | 令人心动的offer(四) | 香港中文大学(深圳)医学院
1 年前
鬼畜的水龙头  ·  MECT需要多少钱? - 知乎
2 年前
安静的回锅肉  ·  【心编丛荐】困在心绪里的儿子_中国劳动关系学院心理中心
2 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号