在面对第一把梭就失败时,我们通常是这么判断的:
1. 如果效果差的很离谱,比如二分类准确率在60%以下,那大概率是模型有问题,开始用小数据集debug
2. 如果有点效果,但一言难尽,那估计是数据有问题,要不然噪声多,要不然是真的难,可以自己看一下训练集,如果人看完后在几秒内都不能给出答案,就别太指望模型可以做好
在第一把效果还行的情况下,推荐尝试以下策略:
1. In-Domain Further Pre-train:
利用同领域下的无监督数据继续MLM预训练,这个方法我真的百试不厌,一般用一两百万的数据就能提升1-2个点;
2. Within-Task Further Pre-Training:
利用不同领域的同任务数据预先精调,选通用一些的一般也有提升;
3. Multi-Task Fine-Tuning:
利用不同任务预先精调;
4. Layer-wise Decreasing Layer Rate:
每层学到的知识都是不同的,前面几层会更通用,所以学的时候可以用小一点的学习率,防止灾难性遗忘;
5. Features from Different layers:
把不同层的输出集成起来,不过这个方法不一定有提升;
6. 长文本处理:
截断或使用层次化编码。
以上这些方法,都出自复旦邱锡鹏老师的
《How to fine-tune BERT for text classification?》
,该文进行了各种详细的实验,得出了不少有用的结论,推荐大家去学习。即使有的方法在论文数据集中表现一般,在自己的数据上也可以尝试。
估计很多同学都知道邱老师,他的
《神经网络与深度学习》(即蒲公英书)
在豆瓣评分9.4,是一本十分适合算法同学入门、复习的读物。
但虽然基础有了,真到coding的时候往往还是下不去手,怎么破?
Don't Worry!
邱神联合百度飞桨,以蒲公英书为基础,出品了配套产业案例与实践的免费教程!
其中很多知识点,都会配上底层代码,帮大家稳稳拿捏,比如BatchNorm:
同时,为了让大家更好地了解该课程的设计思想,提高学习效率,
邱神还将和百度飞浆工程师团队一起做直播,跟大家在线实时交流!(文末报名)
丰富题库实践
深度学习是一门实验性质很强的学科,纯学习理论很难get到不同算法、模型在实际场景中的表现差异和细节影响,边学边练才是这类学科的正确打开方式。这套教程
除常规例程外,还配了近百道习题,选择题、实践题层层递进,有序覆盖最核心的知识点。
(如第八章“注意力机制”就选了『基于自注意力机制完成LCQMC文本语义匹配任务』作为项目实践,这些强匹配的实践题对大家深入理解理论知识是十分有效的。)
产业真实实践案例
产业逐渐向落地应用递进的同时,工程师们面对的真实场景自然增多,练过且有思路的同学要抢手的多。做过落地case的同学都懂,真实场景VS基于理想化数据的代码实践,那就是猛虎 VS Kitty。所以强烈建议大家用好
这门课配套的真实场景实践赛题和范例。
有心、可靠的助攻天团
百度研发工程师每晚视频答疑
,报名、有网就能参加。
由5位飞桨开发者技术专家或NLP方向在读博士生等高阶开发者组成的
助教团将在未来两周全天在线答疑护航。
从此再也不怕无名小坑一卡卡一周了~
在线、免费的GPU环境
真『有网就行』、『有手就行』的平台支持,报名就能使用NVIDIA Tesla V100/A100 GPU算力。
邱神直播开课、实时互动、在线问答
7月19日(周二)20:30
,邱神、百度飞桨团队、机械工业出版社联合直播开讲。
小白、基础不扎实的同学都友好
每章视频课都细分为了数十个小节,非常小白的同学推荐先学前三节,普通同学可以自主学习更深入的小节。并且在
案例与实践部分,每节课会有一半时间会带着大家现场看项目、做实践~一步一步带大家做数据预处理、搭模型、做优化等。
学习旅程的见证:官方结业证书
若能坚持学完课程、完成必修部分的作业实践任务并达到及格,即可获得邱神签名的飞桨官方结业证书,上面有邱神手写鼓励语哦~
重要的事情说三遍
代码开源的!全程免费的!官方出品的!
报名入口在文末!
参与课程过程中,为蒲公英案例与实践教程、飞桨框架、AI Studio平台等部分提供有效建议、纠错、代码等贡献;或结业总成绩进入前50名,即可获得
Tesla V100
GPU算力卡、阶梯奖学金、
百度网盘超级会员、度厂周边
等多种学习激励!
我们会通过Q群(392155840)进行在线答疑助攻、信息同步
(直播开课时间、课程视频及题库地址、闭门答疑会议号、每日学习任务海报、抽奖信息)等,欢迎加入~
扫码立即报名
跟邱神一起强基础!
和飞桨一起练实践!
愿你学有所获,像蒲公英的种子一样在人工智能产业大地上落地生根,与我们一起用知识传递信仰!
原文链接:
https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247580797&idx=1&sn=814bebe09d0454b20caeea7fc6122f36&chksm=96eb63fda19ceaeb64b84ed07b7210db5d08ca16fef9cdd5f2458cad3ea7e78de63be2331a42&scene=126&&sessionid=0
1.1
人工智能
诞生:
人工智能
这个
学
科的诞生有着明确的标志性事件,就是
19
56年的达特茅斯(Dartmouth)会议。在这次会议上,“
人工智能
” 被提出并作为木研究领域的名称。
人工智能
=计算机控制+智能行为;
人工智能
就是要让机器的行为看起来就像是人所表现出的智能行为一样。 ——John McCarthy (
19
27-201
1.分析为什么平方损失函数不适用于分类问题
分类问题中的标签,是没有连续的概念的。每个标签之间的距离也是没有实际意义的,所以预测值 和 标签两个向量之间的平方差这个值不能反应分类这个问题的优化程度。
假设分类问题的类别是1,2,3
那么对于一个真实类别为2的样本X,模型的分类结果是 1 或 3,平方损失函数得到的结果都一样。
显然,不适合
在线性回归中,如果我们给每个样本赋予一个权重,经验风险函数为,计算其最优参数,并分析权重的作用
第一部分·入门篇写在前面第一章 绪论1.1
人工智能
四
月
初《
神经网络
与
深度学习
》又重新发布了,相信有不少人注意到这本书,它由复旦大
学
教授
邱锡鹏
所著。在今年最新的版本中,它融合了一些最新最热的知识点。阅读这本书,一方面是为了巩固已有的基础知识,另一方面,也是查漏补缺,发现自己还不曾了解的知识领域。但单纯地读完一本书会存在遗忘的问题,因此我将在阅读过程中提炼一些关键词,做一些小小的总结。整...
文章作者:
邱锡鹏
复旦大
学
计算机科
学
技术
学
院
教授
、博士生导师注:
文末有赠书活动哦!
《
神经网络
与
深度学习
》——
豆瓣
评分
9.5!复旦大
学
邱锡鹏
教授
力作,周志华、李航联袂推荐,深受好评的
深度学习
讲义“蒲公英书”正式版!系统整理
深度学习
的知识体系,由浅入深地阐述
深度学习
的原理、模型以及方法。更适合中文读者自
学
与入门的
深度学习
图书!使你掌握
神经网络
与
深度学习
技术的基本原理,知其然也知其所以然。上市不到一周即荣登京东和当当新书榜榜首!
邱锡鹏
,复旦大
学
计算机科
学
技术
学
院
教授
、博士生导师,于复旦大
学
获得.
梯度下降
学
习法(感觉英文文章讲的很细,内容其实不多,就是讲的基础了点)既然我们有了
神经网络
的设计,它怎么能
学
会识别数字呢?我们首先需要的是一个数据集,用来
学
习所谓的训练数据集,我们将使用MNIST数据集,其中包含数以万计的手写数字的扫描图像,以及它们的正确分类。MNIST的名字来源于一个事实,即它是由美国国家标准和技术研究所收集的两个数据集的一个修改子集。以下是来自MNIST的一些图片:正如你所看到
点击“小詹
学
Python”,“星标”或"置顶"关键时刻,第一时间送达本文转载自“机器之心”从2016到20
19
,根据多年教
学
和研究经验,
邱锡鹏
教授
完成了
深度学习
教科书《神...
《
神经网络
与
深度学习
》邱希鹏
学
习笔记(4)完成进度第二章
机器学习
概述
机器学习
算法的类型数据的特征表示传统的特征
学
习特征选择特征抽取
深度学习
方法评价指标理论和定理PAC
学
习理论没有免费午餐定理奥卡姆剃刀原理丑小鸭定理归纳偏置自我理解第二章作业启发
第二章(2)
第二章(3)
第二章
机器学习
概述
第二章首先介绍
机器学习
的基本概念和基本要素,并较为详细地描述一个
机器学习
的例子------线性回归
机器学习
(Machine Learning , ML) 通俗地讲
本文作者:Datawhale4
月
7
日
下午,
邱锡鹏
教授
在知乎上达文称整本书终于写完了,虽然还有很多不足。但先告一段落,不然就得无限期拖延下去。感谢众多热心网友的意见和建议。全书的内容可以从...