相关文章推荐
活泼的小熊猫  ·  OpenBabel2.4.1转换mol2格式 ...·  2 年前    · 
独立的椰子  ·  php让mysql_query()查询失败时 ...·  2 年前    · 
聪明伶俐的枇杷  ·  lua 随机数 ...·  2 年前    · 
气宇轩昂的紫菜汤  ·  vue点击编辑按钮,内容变成input可以修 ...·  2 年前    · 
Code  ›  模型算法基础——决策树剪枝算法(二)开发者社区
算法 云计算 企鹅 决策树
https://cloud.tencent.com/developer/article/1033757
侠义非凡的吐司
2 年前
企鹅号小编
0 篇文章

模型算法基础——决策树剪枝算法(二)

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
企鹅号小编
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
社区首页 > 专栏 > 人工智能 > 模型算法基础——决策树剪枝算法(二)

模型算法基础——决策树剪枝算法(二)

作者头像
企鹅号小编
发布 于 2018-02-01 09:58:42
1.8K 0
发布 于 2018-02-01 09:58:42
举报

在上一篇模型算法基础——决策树剪枝算法(一)中,我们介绍了误差降低剪枝(REP),今天我们继续介绍另一种后剪枝算法—— 悲观错误剪枝(PessimisticError Pruning/PEP) 。

悲观错误剪枝也是根据剪枝前后的错误率来决定是否剪枝,和REP不同的是,PEP不需要使用验证样本,并且PEP是 自上而下 剪枝的。由于还是用生成决策树时相同的训练样本,那么对于每个节点,剪枝后错分率一定是会上升的,因此在计算错分率时需要加上一个经验性的惩罚因子1/2。假设T表示考虑是否剪枝的某节点,t表示该节点下的叶子节点,N(t)表示节点t覆盖的样本个数,e(t)表示节点t的错分样本个数,那么节点T的错分率:

也就是说,每一个样本有E(Tt)的概率分类正确,1- E(Tt)的概率分类错误。可以认为错分次数服从Bernoulli分布,其期望为:

标准差为:

如果对T进行剪枝,当T节点成为叶子节点后的错分率:

如果有

则认为该节点需要剪枝。

还是用REP中训练样本的栗子,我们考虑T4节点(假设母节点们都不需要剪枝):

由于6+2.05>7,因此根据PEP判断节点T4需要剪枝。

悲观错误剪枝的准确度较高,且不需要分离训练样本和验证样本,对样本量较少的情况比较有利。同时,每棵子树最多只需要访问一次,效率较高。但是由于方向是自上而下,可能会造成某些不必要的剪枝。

本文来自企鹅号 - 全球大搜罗 媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

人工智能
编程算法
决策树

本文来自企鹅号 - 全球大搜罗 媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

人工智能
编程算法
决策树
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
关于作者
企鹅号小编
腾讯
0
文章
0
累计阅读量
0
获赞
前往专栏
领券
  • 社区

    • 专栏文章
    • 阅读清单
    • 互动问答
    • 技术沙龙
    • 技术视频
    • 团队主页
    • 腾讯云TI平台
  • 活动

    • 自媒体分享计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 资源

    • 技术周刊
    • 社区标签
    • 开发者手册
    • 开发者实验室
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 商标注册
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2023 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2023 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
活泼的小熊猫  ·  OpenBabel2.4.1转换mol2格式到pdbqt格式_pdbqt文件怎么转mol文件_DrugAI的博客-CSDN博客
2 年前
独立的椰子  ·  php让mysql_query()查询失败时,显示错误信息_php 输出mysqli_query 错误 die_美奇开发工作室的博客-CSDN博客
2 年前
聪明伶俐的枇杷  ·  lua 随机数 math.random()和math.randomseed()用法 - 口头猿 - 博客园
2 年前
气宇轩昂的紫菜汤  ·  vue点击编辑按钮,内容变成input可以修改,也可以删除_51CTO博客_vue点击编辑可以修改文字
2 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号