#计算对数收益率
data$return2=c(0,( log((data$CLOSE.y[-1])/data$CLOSE.y[-nrow(data)])))
合并因子数据和收益率数据
image.png
image.png
经过对模型的检验得到以下结果:
逻辑回归收益分布
image.png
逻辑回归收益的直方图 可以看到大部分收益分布在大于0的区域
图中显示了根据模型所选股票在当期的收益率分布。从图中可以看出大部分股票收益率分布在0%至-10%之间,将近半数的股票在其交易当期内具有小额负收益。
image.png
image.png
这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益
累计收益
image.png
组合累积和基准累积
image.png
这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益率:
image.png
通过图中对利用Logistic选股模型选出的组合的收益率和基准收益率的对比可以看出看出通过Logistic选股模型选出的组合具有一个较平稳的收益率,而且在绝大数的时间内收益率超过了基准收益。由此可以看出Logistic选股模型具有一定的稳定性和有效性,在绝大多数的情况下可以选出收益率高于基准收益的组合。
组合和基准每月的收益率的对比图
2.png
1.png
逻辑回归模型结果
Deviance Residuals:
Min 1Q Median 3Q Max
-0.86049 -0.32622 -0.05835 -0.00147 2.24675
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 7.199e+00 9.101e+00 0.791 0.429
SHARE_TOTALTRADABLE -9.482e-10 1.934e-09 -0.490 0.624
MKT_CAP -4.653e-11 5.952e-11 -0.782 0.434
MV -1.687e+00 2.033e+00 -0.830 0.407
pe -9.811e-02 1.128e-01 -0.870 0.384