
Scikit-Learn与TensorFlow机器学习实用指南(书籍)
从零开始的机器学习实用指南(四):训练模型
之前我们把许多机器学习算法当作黑盒,尽管这样,我们还是解决了许多问题,比如房价预测和手写数字识别。 但是,如果你对模型内部的过程更了解的话,可以方便更好的调试参数和分析误差 以线性回归为例,讨论两种求解模型的方法 通过运算封闭的方程式直接求解,得到最优参数通过迭代优化的方法:梯度下降,和它的一些变体 线性回归之前介绍了线性回归的例子,比如人民幸福指数的预测(第一章),以及用MSE来衡量模型的好坏 [公式]
《Hands-On Machine Learning》学习笔记3 — 数据获取与清洗
红色石头的个人网站:红色石头的个人博客-机器学习、深度学习之路 本章将完整地介绍一个端对端(End-to-End)机器学习项目。假如你是某个房地产公司刚雇佣的数据科学家,你所要做的事情主要分成以下几个步骤: 1.整体规划。 2.获取数据。 3.发现、可视化数据,增加直观印象。 4.为机器学习准备数据。 5.选择模型并进行训练。 6.调试模型。 7.给出解决方案。 8.部署、监控、维护系统 1. 使用真实数据学习机器学习时,最好使用真实…
《Hands-On Machine Learning》学习笔记4 — 数据探索与可视化、发现规律
红色石头的个人网站:红色石头的个人博客-机器学习、深度学习之路 目前为止,我们已经对数据有了初步的认识,大体上明白了我们要处理的数据类型。现在,我们将进入更深入的研究。 首先,确保已经划分了测试集并放置一边,我们只会对训练集进行操作。另外,如果训练集很大,可以从中采样一些作为探索集(exploration set),方便进行快速处理。在我们这个例子中,数据集比较小,所以直接在训练集上处理即可。我们还要创建一个训练…
Scikit-Learn&TensorFlow机器学习实用指南(二):一个完整的机器学习项目【上】
机器学习实用指南(二):一个完整的机器学习项目【上】作者:LeonG 本文参考自:《Hands-On Machine Learning with Scikit-Learn & TensorFlow 机器学习实用指南》,感谢中文AI社区ApacheCN 提供翻译。 本文全部代码和数据集保存在我的github-----LeonG的github 1. 学习前提建议掌握以下知识的基础内容: python编程numpy、matplotlib、pandas科学计算库python是机器学习分析的编程基础,numpy、matplotlib、pandas是机器学习中常用…
从零开始的机器学习实用指南(五):支持向量机
支持向量机是强大并且用途广泛的机器学习工具,可以完成线性或者非线性的分类,回归,甚至离群点检测,尤其适合于那些复杂但是小型或者中型数据上的分类任务 线性SVM分类器 [图片] 这个图展示的是上一张的花朵分类,可以看出,这两个类是线性可分的,并且,存在着许多分类的方法,比如右图展示了三条决策边界都可以分开他们。简而言之,SVM追求的不只是分开他们,还希望决策边界到两个类的距离尽可能宽(中间实线那样),这叫最大分隔分…
先固定随机种子,你每次调的其他参数才有对比价值,不然每次结果都波动,你怎么知道哪个超参数最好?不同种子对于其他超参数是通用的,你要是觉得种子不好,可以调完其它参数了单独改种子试试
图解机器学习神器:Scikit-Learn
原文: https://www.showmeai.tech/article-detail/203 欢迎关注 @Python小二 ,专注 Python爬虫、数据分析、实战项目等! 图解机器学习 本文详解 scikit-learn 工具库的用法,覆盖机器学习基础知识、SKLearn讲解、SKLearn三大核心API、SKLearn高级API等内容。 [文章: Python笔记大全(入门+爬虫+数据分析可视化+机器学习+深度学习)] 我们在上一篇 SKLearn入门与简单应用案例[1] 里给大家讲到了 SKLearn 工具的基本板块与使用方法,在本篇内容中,我们展开讲解SKLearn…