上一篇文章对于华泰金工人工智能选股系列之随机森林模型进行了复现的初探。实际上随机森林模型本身是bagging这一集成学习算法在决策树中的应用,其本质是对训练集的样本进行bootstrap随机抽样n次,建立n棵决策树,让森林中的每一棵树对测试集的新样本进行预测投票,票多者胜(分类问题)或是取均值(回归问题)。

由此可知随机森林的n个分类器是并行的,而boosting与bagging不同,boosting中的分类器的生成是串行的,由第一个分类器的拟合结果生成第二个分类器,依次类推。其实质是一种迭代算法。

常见的Adaboost的迭代是对训练集中的样本的权重进行迭代更新。即每一次拟合的损失函数都根据上一个模型拟合结果的好坏赋予新的权重。对于分类问题来说,错分类的样本将在下一轮拟合的损失函数中赋予更高的权重,以期在下一轮拟合中提高准确率。回归问题思路类似。最终将迭代产生的多个分类器按其表现效果加权得出结果。

而GBDT则是将上一轮拟合的残差作为新的被解释变量,迭代生成下一个模型。最终将迭代的若干个模型线性加总。其结果就是所得模型会不断的降低训练集的误差。

本文将沿用上一篇文章所使用的数据,对研报内容进行复现的尝试。

1.调参和交叉验证:

调参与交叉验证选择了语言包相同的参数进行调整,最终所选参数与研报一致。

2.回测:

选择了模型打分最优的前若干只股票等权配置,月初调仓,结果如下。
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
值得一提的是,xgboost不仅在回测中表现优于随机森林,在运行速度上远超后者。

另外,xgboost与随机森林在每月选股的重合度上大致约为40%。

报告对各种 Boo s ting 集成学习 模型 进行系统测试 Boo s ting 集成学习 模型 将多个弱学习器串行结合,能够很好地兼顾 模型 的 偏差和方差,该类 模型 在最近几年获得了长足的发展,主要包括Ada Boo st、 GBDT、 XGBoost 。本篇报告我们将对这三种 Boo s ting 集成学习 模型 进行 系统性的测试,并分析它们应用于 多因子 选股 的异同,希望对本领域的投 资者产生有实用意义的参考价值。 在此处下载最新版本: : qLib是SideFX的Houdini的数字资产库。 它是旨在与Houdini的本机工具集完美协作的工具集合。 它由实际的生产环境驱动(并在实际的生产环境中使用),但与此同时,它完全尊重并符合所有重要的Houdini概念。 重点强调以下内容: 向后兼容:旧场景不会随着时间推移而中断 性能:我们尽可能争取VEX /多线程 可用性:我们的工具会尽量避免“内部”外观 qLib是根据获得许可的开源软件。 它是由多家电影公司的VFX专业人士开发的,这些电影公司从事故事片,游戏电影和广告业务。 几何属性和组的生成,操纵和可视化 边界几何的生成和处理 通过通用的变形器框架实现的完整变形器套件 重新实现了某些原始Houdini OP的高性能版本 工作流程相关工具 大量图库项目(节点和子网预设) 研报 点评 该 研报 以CAPM为其金融逻辑对全市场进行择时,其预测逻辑为:全市场风险溢价具有持续性(动量),短期市场收益率虽然有波动,但是中期来看,一般会集聚地保持正溢价一段时间,然后切换。对此,只要估计出前期市场期望溢价是否为正,即可买入。 本文逻辑较为通顺,但是也较为简单,采用了比较“炫的”beta与收益率是否有正相关(spearman系数)来衡量,直白来看,类似过去N日市场平均收益率是否大于0,大于0即买入。但是本文的角度和平滑方法值得思考,具有启发意义。 资本资产定价 模型 (Capital Asset. 基于北向资金指数择时策略验证与思考 本文思路 华泰 金工 研量化资产配置7月月报《北向资金走向预示市场短期或震荡》关于北上资金的择时思路,构建基于北向资金的股市择时策略,并进行历史回测。结果表明,北向资金对于判断沪深 300指数涨跌具有较好的预示作用。 上述 研报 的核心内容简述: 1、北向资金与沪深 300 相关系数自陆股通开通以来逐渐攀升至 0.5 以上,相关性较高。 2、当前北向资金指标显示短期市场仍可能会以震荡调整为主。 基本验证思路: 1、首先验证该 研报 所述结论是否正确。 2、如果正确,基于北向资金是否能研 人工智能 机器学习 方法并不神秘,其本质是以数理 模型 为核心工具,结 合控制论、认知心理学等其它学科的研究成果,最终由计算机系统模拟人 类的感知、推理、学习、决策等功能。理解常用的 机器学习 算法,有助于 澄清对 人工智能 的种种误解和偏见,帮助我们更清晰地认识 人工智能 的长 处和局限,从而更合理、有效地将 人工智能 运用于投资领域。