kaggle竞赛宝典 公众号建立的初衷是希望将很多经典比赛的方案写成案例的形式,每个步骤都配有一定的阐述,讲述某些操作为什么有效等,希望可以帮助更多的新手快速入门(太多的开源只有代码,看代码的时间是巨大的,复现的代价也是很大的,而且很多操作也不一定有效)。到目前为止, kaggle竞赛宝典 已经有9个kaggle的到银牌的案例,以及10+个国内竞赛的案例,此处将这些案例以及对应的链接一起汇总在下方,方便大家快速查找学习。

Kaggle平台

1. Web Traffic Time Series Forecasting 比赛(时序问题)

​Web_Traffic_Part1赛题分析​

​Web_traffic_Part2_EDA​

​Web_traffic_Part3_银牌NN方案​

​Web银牌规则方案​

2. Corporación Favorita Grocery Sales Forecasting (时序问题)

​Corporación Favorita_赛题分析​

​Corp_数据探索分析Part2_单变量数据探索​

​Corp_数据探索分析Part3_特征变量&标签关系分析​

​Corp_数据探索分析Part4_特征变量&特征变量关系分析​

​Corp_Baseline​

​Corp_银牌方案​

3. Santander Customer Transaction Prediction (匿名,二分类)

​Santander Customer Transaction Prediction竞赛Part1_EDA​

​Santander Customer Transaction Prediction竞赛Part2_LB:0.900​

​Santander Customer Transaction Prediction竞赛Part3_Magic(银牌)​

​Santander Customer Transaction Prediction竞赛Part4_Top1%​

​Santander Customer Transaction Prediction竞赛Part5_方案汇总​

4. Microsoft Malware Prediction(二分类,时序)

​Microsoft Malware Prediction比赛EDA_Part1​

​Microsoft Malware Prediction比赛Part2_LGBBaseline(LB:0.694)​

​Microsoft Malware Prediction比赛Part3_AvSig强特+LGB(0.701)​

5. Click-Through Rate Prediction (推荐)

​Click-Through Rate Prediction:数据探索分析(Part1)​

​Click-Through Rate Prediction:银牌(Part2)​

6. Instacart Market Basket Analysis (推荐)

​Instacart Market Basket Analysis(Part 1):EDA&Baseline​

​Instacart Market Basket Analysis(Part 2):0.3787363​

​Instacart Market Basket Analysis(Part3_1):0.4036596(铜牌)​

​Instacart Market Basket Analysis(Part3_2):0.4036596(铜牌)​

7. Titanic: Machine Learning from Disaster (二分类,入门)

​Titanic: Machine Learning from Disaster​

8. Kaggle Two Sigma(股票预测 )

​Kaggle Two Simga 第四名方案 Part 1​ ​(Shannon提供)

​Kaggle Two Simga 第四名方案 Part 2​ ​(Shannon提供)

​Kaggle Two Simga 第四名方案 Part 3 NN模型​ ​(Shannon提供)

9. IEEE-CIS Fraud Detection (二分类,欺诈)

​IEEE-CIS Fraud Detection_Part1_赛题分析​

​IEEE比赛的一些建议&秋招AI/机器学习/数据挖掘岗位面试注意点​

​IEEE Part3: 有趣的强特&强tricks​

10. ASHARE (分类, 剩余的赛后补充

​ASHARE_Part1: 赛题分析​

国内竞赛平台

1. CMTR(KDD19,推荐,多分类)

​ContextAware MultiModal Transportation Recommendation Part1赛题解析​

​ContextAware MultiModal Transportation Recommendation Part2 EDA​

​CAMMTR(KDD19)_Part3_多分类Baseline分享(含Code)​

​CAMMTR(KDD19)_Part4_复赛top10方案(含Code)​

2. NIPS2018 AutoML比赛(匿名,多数据集)

​2018年NIPS会议AutoML大赛Part1,AutoFeature篇​

​18NIPSAutoML Part2&3,ModelSelection&Hyperpara Tuning​

3. JDATA19_用户对品类下店铺的购买预测(时序,推荐)

​JDATA19_用户对品类下店铺的购买预测_A榜0.058(top20)方案​

4. 全球城市计算AI挑战赛(时序,回归)

​全球城市计算AI挑战赛Part1_EDA​

​天池地铁流量预测Part2_Rule(LB_12.10,Top2%)​ ​ (人畜无害小白兔提供)

​全球城市计算AI挑战赛Part3_(A top1, C top2方案)​

5. 信贷用户逾期预测(二分类,欺诈)

​“信贷用户逾期预测”算法大赛优胜奖方案分享​

6. 天文数据挖掘大赛(多分类,天文)

​天文数据挖掘大赛方案季军方案​

7.  JDD人口动态普查(时序)

​JDD人口动态普查与预测,2018(正逆向时序建模)​

8. 工程机械设备故障预测(多分类)

​基于机器学习的工程机械设备故障预测系统Part1 - EDA 部分​

​基于机器学习的工程机械设备故障预测系统Part2 -- Top5方案​

​基于机器学习的工程机械设备故障预测系统Part3 -- 测试集leak​

9.  消费者人群画像—信用智能评分

​MSE+MAE提高回归精度的方法(消费者人群画像—信用智能评分为例)​

​消费者人群画像-信用智能评分Top1​ ​ (有夕提供)

10.  腾讯广告算法大赛19

​腾讯广告算法大赛19_Top5方案&代码​ ​(有夕提供)

​2019腾讯广告算法大赛方案分享(冠军)​

11.  科大讯飞工程机械核心部件寿命预测挑战赛(New!)

​科大讯飞工程机械核心部件寿命预测挑战赛冠军分享​

12.  科大讯飞工程机械核心部件寿命预测挑战赛(New!)

​2019CCF-BDCI-乘用车细分市场销量预测方案(Top1%)​

13.  CCF BDCI新闻情感分类(New!)

​CCF BDCI新闻情感分类初赛A榜4/2735,复赛Top1%题解报告​

14.  DigSci科学数据挖掘大赛(New!)

​DigSci科学数据挖掘大赛:​ ​​ ​如何在3天内拿下DigSci亚军​

太强了!Kaggle竞赛宝典方案汇总_Customer