研报复现初探—华泰金工人工智能选股系列之boosting模型_lilingyu1993的博客

相关文章推荐

打盹的斑马 · 《巴啦啦小魔仙》现状：一位早逝，两位翻车，反 ...· 1 年前 ·

潇洒的硬币 · 武昌菜场之光，搬进了地铁· 1 年前 ·

完美的杯子 · 匠心之作，海南黄花梨，戏狮弥勒_形象_雕刻_布袋· 1 年前 ·

道上混的豌豆 · Power BI Desktop ...· 1 年前 ·

一身肌肉的蛋挞 · 滚球体育网址长城汽车副总裁佘尚锋：围绕数据_ ...· 2 年前 ·

上一篇文章对于华泰金工人工智能选股系列之随机森林模型进行了复现的初探。实际上随机森林模型本身是bagging这一集成学习算法在决策树中的应用，其本质是对训练集的样本进行bootstrap随机抽样n次，建立n棵决策树，让森林中的每一棵树对测试集的新样本进行预测投票，票多者胜（分类问题）或是取均值（回归问题）。

由此可知随机森林的n个分类器是并行的，而boosting与bagging不同，boosting中的分类器的生成是串行的，由第一个分类器的拟合结果生成第二个分类器，依次类推。其实质是一种迭代算法。

常见的Adaboost的迭代是对训练集中的样本的权重进行迭代更新。即每一次拟合的损失函数都根据上一个模型拟合结果的好坏赋予新的权重。对于分类问题来说，错分类的样本将在下一轮拟合的损失函数中赋予更高的权重，以期在下一轮拟合中提高准确率。回归问题思路类似。最终将迭代产生的多个分类器按其表现效果加权得出结果。

而GBDT则是将上一轮拟合的残差作为新的被解释变量，迭代生成下一个模型。最终将迭代的若干个模型线性加总。其结果就是所得模型会不断的降低训练集的误差。

本文将沿用上一篇文章所使用的数据，对研报内容进行复现的尝试。

1.调参和交叉验证：

调参与交叉验证选择了语言包相同的参数进行调整，最终所选参数与研报一致。

2.回测：

选择了模型打分最优的前若干只股票等权配置，月初调仓，结果如下。
这里写图片描述

值得一提的是，xgboost不仅在回测中表现优于随机森林，在运行速度上远超后者。

另外，xgboost与随机森林在每月选股的重合度上大致约为40%。

报告对各种 Boo s ting 集成学习模型进行系统测试 Boo s ting 集成学习模型将多个弱学习器串行结合，能够很好地兼顾模型的偏差和方差，该类模型在最近几年获得了长足的发展，主要包括Ada Boo st、 GBDT、 XGBoost 。本篇报告我们将对这三种 Boo s ting 集成学习模型进行系统性的测试，并分析它们应用于 多因子 选股的异同，希望对本领域的投资者产生有实用意义的参考价值。在此处下载最新版本：： qLib是SideFX的Houdini的数字资产库。它是旨在与Houdini的本机工具集完美协作的工具集合。它由实际的生产环境驱动（并在实际的生产环境中使用），但与此同时，它完全尊重并符合所有重要的Houdini概念。重点强调以下内容：向后兼容：旧场景不会随着时间推移而中断性能：我们尽可能争取VEX /多线程可用性：我们的工具会尽量避免“内部”外观 qLib是根据获得许可的开源软件。它是由多家电影公司的VFX专业人士开发的，这些电影公司从事故事片，游戏电影和广告业务。几何属性和组的生成，操纵和可视化边界几何的生成和处理通过通用的变形器框架实现的完整变形器套件重新实现了某些原始Houdini OP的高性能版本工作流程相关工具大量图库项目（节点和子网预设）研报点评该研报以CAPM为其金融逻辑对全市场进行择时，其预测逻辑为：全市场风险溢价具有持续性（动量），短期市场收益率虽然有波动，但是中期来看，一般会集聚地保持正溢价一段时间，然后切换。对此，只要估计出前期市场期望溢价是否为正，即可买入。本文逻辑较为通顺，但是也较为简单，采用了比较“炫的”beta与收益率是否有正相关（spearman系数）来衡量，直白来看，类似过去N日市场平均收益率是否大于0，大于0即买入。但是本文的角度和平滑方法值得思考，具有启发意义。资本资产定价模型 (Capital Asset. 基于北向资金指数择时策略验证与思考本文思路华泰金工研量化资产配置7月月报《北向资金走向预示市场短期或震荡》关于北上资金的择时思路，构建基于北向资金的股市择时策略，并进行历史回测。结果表明，北向资金对于判断沪深 300指数涨跌具有较好的预示作用。上述研报的核心内容简述： 1、北向资金与沪深 300 相关系数自陆股通开通以来逐渐攀升至 0.5 以上，相关性较高。 2、当前北向资金指标显示短期市场仍可能会以震荡调整为主。基本验证思路： 1、首先验证该研报所述结论是否正确。 2、如果正确，基于北向资金是否能研 人工智能 和 机器学习 方法并不神秘，其本质是以数理模型为核心工具，结合控制论、认知心理学等其它学科的研究成果，最终由计算机系统模拟人类的感知、推理、学习、决策等功能。理解常用的 机器学习 算法，有助于澄清对 人工智能 的种种误解和偏见，帮助我们更清晰地认识 人工智能 的长处和局限，从而更合理、有效地将 人工智能 运用于投资领域。