#计算对数收益率 data$return2=c(0,( log((data$CLOSE.y[-1])/data$CLOSE.y[-nrow(data)])))

合并因子数据和收益率数据

image.png
image.png
image.png
image.png

经过对模型的检验得到以下结果:

逻辑回归收益分布

image.png
image.png

逻辑回归收益的直方图 可以看到大部分收益分布在大于0的区域

图中显示了根据模型所选股票在当期的收益率分布。从图中可以看出大部分股票收益率分布在0%至-10%之间,将近半数的股票在其交易当期内具有小额负收益。

image.png
image.png
image.png
image.png

这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益

累计收益

image.png
image.png

组合累积和基准累积

image.png
image.png

这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益率:

image.png
image.png

通过图中对利用Logistic选股模型选出的组合的收益率和基准收益率的对比可以看出看出通过Logistic选股模型选出的组合具有一个较平稳的收益率,而且在绝大数的时间内收益率超过了基准收益。由此可以看出Logistic选股模型具有一定的稳定性和有效性,在绝大多数的情况下可以选出收益率高于基准收益的组合。

组合和基准每月的收益率的对比图

2.png
2.png
1.png
1.png

逻辑回归模型结果

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-0.86049  -0.32622  -0.05835  -0.00147   2.24675  
Coefficients:
                      Estimate Std. Error z value Pr(>|z|)
(Intercept)          7.199e+00  9.101e+00   0.791    0.429
SHARE_TOTALTRADABLE -9.482e-10  1.934e-09  -0.490    0.624
MKT_CAP             -4.653e-11  5.952e-11  -0.782    0.434
MV                  -1.687e+00  2.033e+00  -0.830    0.407
pe                  -9.811e-02  1.128e-01  -0.870    0.384