Kaggle
入门实战:
Titan
ic
-
Machine
L
ear
ning
from
Dis
aster
项目简介关于数据数据概括数据字段描述数据分析总体思路初步分析
Use
machine
l
ear
ning
to create a model that pred
ic
ts wh
ic
h passengers survived the
Titan
ic
shipwreck.
基于
机器学习
建立模型预测泰坦尼克号灾难中哪些乘客得以生存。
Kaggle
入门项目:
Titan
ic
overview
参考分析视频:B
Correcting by dropping features
Creating new feature extracting from existing
Converting a categor
ic
al feature
Create new feature combi
ning
exis
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖…已保研。目前正在学习C++/Linux/
Python
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
初学
Python
小白阶段
文章仅作为自己的学习笔记 用于知识体系建立以及复习
题不在多 学一题 懂一题
知其然 知其所
好的,下面给你介绍一些从
Kaggle
、UCI
Machine
L
ear
ning
Repository等平台中选定的常见数据集。
1.
Titan
ic
:
Machine
L
ear
ning
from
Dis
aster
(
Kaggle
)
该数据集包含有关泰坦尼克号乘客的信息,包括乘客的姓名、性别、年龄、票价等等。目标是根据乘客的特征预测他们是否在灾难中幸存下来。该数据集包含891个训练样本和418个测试样本。
2. Wine Quality(UCI
Machine
L
ear
ning
Repository)
该数据集包含红葡萄酒和白葡萄酒的化学特征,例如酸度、酒精含量、pH值等等。目标是根据化学特征预测酒的质量评分。该数据集包含4898个样本。
3. Fashion MNIST(
Kaggle
)
该数据集包含10个类别的时尚商品图片,包括T恤、裤子、衬衫等等。目标是根据图片预测它所属的类别。该数据集包含60,000个训练样本和10,000个测试样本。
4. Boston Housing(UCI
Machine
L
ear
ning
Repository)
该数据集包含波士顿地区的房屋价格和房屋属性信息,例如房龄、房间数量、犯罪率等等。目标是根据房屋属性预测房屋价格。该数据集包含506个样本。
以上是一些常见的数据集,它们包含了不同类型的数据,可以用于不同的
机器学习
任务。如果你需要更多的数据集,可以在
Kaggle
、UCI
Machine
L
ear
ning
Repository等平台上进行搜索。