相关文章推荐
爱喝酒的蛋挞  ·  網路掛號-依醫師姓名 - 中國醫藥大學附設醫院·  9 月前    · 
瘦瘦的小摩托  ·  伺服电机十大品牌排行榜·  1 年前    · 
微笑的饼干  ·  【通信工程】通信行业常用缩写名词解释v1_通 ...·  2 年前    · 
无邪的丝瓜  ·  2021 6月中药粉碎机购买推荐 - 知乎·  2 年前    · 
气宇轩昂的豆腐  ·  开局吻上裂口女漫画免费 - ...·  2 年前    · 
Code  ›  Hoeffding不等式的认识以及泛化误差上界的证明开发者社区
https://cloud.tencent.com/developer/article/1091641
体贴的水煮肉
2 年前
作者头像
云时之间
0 篇文章

Hoeffding不等式的认识以及泛化误差上界的证明

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP
返回腾讯云官网
社区首页 > 专栏 > 云时之间 > Hoeffding不等式的认识以及泛化误差上界的证明

Hoeffding不等式的认识以及泛化误差上界的证明

作者头像
云时之间
发布 于 2018-04-11 13:34:35
2.3K 0
发布 于 2018-04-11 13:34:35
举报

参考书目和论文:《统计学习方法》

A Tutorial on Support Vector Machine for Pattern Recognition

在机器学习中我们知道学习方法的泛化能力往往是通过研究泛化误差的概率上界所进行的,这个就简称为泛化误差上界。用直观的理解,在有限的训练数据中得到一个规律,认为总体也是近似这个规律的,那么就能用这个规律进行预测。比如一个大罐子里装满了红球和白球,各一半,我随手抓了一把,然后根据这些红球白球的比例预测整个罐子也是这样的比例,这样做不一定很准确,但结果总是近似的,而且如果抓出的球越多,预测结果也就越可信。具体来说就是通过比较两种学习方法的误差上界来比较他们的优劣。现在根据李航博士在《统计学习方法》中的例子,我来自己证明下泛化误差上界。毕竟自己学会推导才是自己的,看的懂的反而不一定。

1:二分类问题的泛化误差上界

考虑到二分类问题。现在假设给定一组训练数据集合T。这组数据集时从联合概率分布P(x,y)独立同时分布产生的。现在假设这个小空间是一个函数的有限集F={f1,f2,...,fd},d是函数个数。设f是从F中选取的函数。现在的损失函数我们定义为0-1损失。

这样关于f的期望损失和经验损失分别是:

对于f(n)的泛化能力:

现在对F中有限集合中任意选出函数f的泛化误差上界:

泛化误差上界定理:假设当前空间是有限个函数的集合,对任意一个函数f∈F,至少以概率1−σ,以下的不等式成立:

不等式左端R(f)是泛化误差,右端为泛化误差上界。泛化误差上界中,第一项是训练误差,训练误差越小,泛化误差也越小。第二项ε(d,N,δ),N越大,值越小,假设空间F包含的函数越多,值越大。这个定理可以从概率上说明使用经验风险近似期望风险的可信度,它与样本数量以及假设空间的复杂度有关。这个定理可以从概率上说明使用经验风险近似期望风险的可信度,它与样本数量以及假设空间的复杂度有关。

上述的定理可以用Hoeffding不等式来证明:

对于Hoeffding定理的一些理解:

Hoeffding不等式是关于一组随机变量均值的概率不等式。 如果X1,X2,⋯,Xn为一组独立同分布的参数为p的伯努利分布随机变量,n为随机变量的个数。定义这组随机变量的均值为:

对于任意δ>0, Hoeffding不等式可以表示为:

图片发自简书App

在《统计机器学习》中的Hoeffding的公式为如下所示,好像有很多的版本。

令X1,…,Xn为独立同分布随机变量,满足ai≤Xi≤bi。则对于任意t>0有

至于这个公式怎么推导,其实我也不会,建议大家还是不要为难自己了。哈哈

而这个公式的用途:

在统计推断中,我们可以利用样本的统计量(statistic)来推断总体的参数(parameter),譬如使用样本均值来估计总体期望。如下图所示,我们从罐子里抽球,希望估计罐子里不同颜色球的比例。

直觉上,如果我们有更多的样本(抽出更多的球),则样本期望ν应该越来越接近总体期望μ。事实上,这里可以用hoeffding不等式表示如下:

从hoeffding不等式可以看出,当n逐渐变大时,不等式的UpperBound越来越接近0,所以样本期望越来越接近总体期望。

回到我们的泛化误差上界的推导中:

对任意函数f∈F,R^(f) 是N个独立随机变L(Y,f(X))的样本均值(经验期望),R(f)是期望,如果损失函数取之区间为[0, 1],则根据上述Hoeffding不等式,得到:

由于F={f1,f2,...,fd}是一个有限集合,容易得到:

令

然后就得到了:

上面的讨论只是假设空间包含有限个函数的情况下的泛化误差上界,对于一般的假设空间要找到泛化误差界应该就没这么简单了。

不足之处还请各位多多指教!欢迎大家提出建议,我将很珍惜大家的看法。谢谢!

本文参与 腾讯云自媒体分享计划 ,分享自作者个人站点/博客。
原始发表:2017.03.06 , 如有侵权请联系 cloudcommunity@tencent.com 删除
机器学习

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

机器学习
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
关于作者
云时之间
天津市国瑞数码有限公司机器学习工程师
0
文章
0
累计阅读量
0
获赞
前往专栏
领券
  • 社区

    • 专栏文章
    • 阅读清单
    • 互动问答
    • 技术沙龙
    • 技术视频
    • 团队主页
    • 腾讯云TI平台
  • 活动

    • 自媒体分享计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 资源

    • 技术周刊
    • 社区标签
    • 开发者手册
    • 开发者实验室
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 商标注册
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2023 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2023 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
爱喝酒的蛋挞  ·  網路掛號-依醫師姓名 - 中國醫藥大學附設醫院
9 月前
瘦瘦的小摩托  ·  伺服电机十大品牌排行榜
1 年前
微笑的饼干  ·  【通信工程】通信行业常用缩写名词解释v1_通信行业名词缩写解释 pdf-CSDN博客
2 年前
无邪的丝瓜  ·  2021 6月中药粉碎机购买推荐 - 知乎
2 年前
气宇轩昂的豆腐  ·  开局吻上裂口女漫画免费 - 开局吻上裂口女漫画 - 漫画在线全集免费阅读 - 腾讯动漫
2 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号