kaggle上面有哪些适合机器学习新手的比赛和项目?

学习机器学习一段时间了,掌握了线性回归,逻辑回归,梯度下降,正则化,神经网络前向传播和反向传播,现在想自己练练手,希望能够推荐一些kaggle上的比赛…
关注者
103
被浏览
135,002
登录后你可以
不限量看优质回答 私信答主深度交流 精彩内容一键收藏

感谢邀请。

0基础的人如何上手Kaggle?

理论上来讲,Kaggle欢迎任何数据科学的爱好者,不过实际上,要想真的参与其中,还是有一定门槛的。一般来讲,参赛者最好具有统计、计算机或数学相关背景,有一定的coding技能,对机器学习和深度学习有基本的了解。Kaggle任务虽然不限制编程语言,但绝大多数队伍会选用Python和R,所以你应该至少熟悉其中一种。此外,对于那些对成绩有追求的人,Feature Engineering也是必不可少的。但对于Data Science的入门者来说,这样的要求实在是有些过分了。对于这一块想要进一步了解的同学可以看这个问题: 特征工程到底是什么 ?其中 @城东 的答案( 点这里 )和 @张戎 的答案( 点这里 )都非常详细。

当然,如果你从未独立做过一个项目,还是要从 练习赛开始熟悉 。因为竞赛模式中的任务是公司悬赏发布的实际案例,并没有标准的答案;而练习赛不仅项目难度低,而且是有官方给出的参考方案的,大家可以用来对比改善自己的测试结果,从中进行提高。所以呢,建议感兴趣的同学先去独立做一下101和playground的训练赛,至于做多少个案例才能上道,就要看个人素质啦。这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的三个经典练习项目,供大家学习。

1. Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾
英文教程: An Interactive Data Science Tutorial

2. House Prices: Advanced Regression Techniques(房价预测)
中文教程: Kaggle竞赛 — 2017年房价预测
英文教程: How to get to TOP 25% with Simple Model using sklearn

3. Digital Recognition(数字识别)
中文教程: 大数据竞赛平台—Kaggle 入门
英文教程: Interactive Intro to Dimensionality Reduction


详细内容可以参考我之前的两篇专栏: