对于python的学习,首先是对语言的理解,其次就是python库的学习,从Numpy,Pandas,Scipy,Matplotlib的基础库的使用,到Sklearn机器学习库的使用,这也是python学习发展的主线,下面就介绍三个最牛的python机器学习库,之后将会对这三个机器学习库进行深入探究。
转载自: opensource
尽管并不一定是数据科学家对机器学习的世界着迷,但是一些旅行指南可能会帮助您遨游包括大数据、人工智能和深度学习,以及大量的统计和分析的浩瀚的宇宙。(“深度学习”和“机器学习”通常可以互换使用,因此对于一个快速的术语介绍,可能有助于您了解差异,阅读Nvidia的博客文章:人工智能,机器学习和深度学习之间的区别是什么?[1])
在本文中,我将讨论三个最受欢迎的Python机器学习库。
Theano[2]在十年以前发布,主要由蒙特利尔大学的机器学习小组开发,是机器学习社区中最常用的CPU和GPU数学编译器之一。 2016年的一篇论文,Theano:快速计算数学表达式的Python框架[3],提供了对库的彻底概述。文章解释说。“基于Theano的优势,多个软件包已经开发了,他们具有更高级别的用户界面,更适合于某些目标。Lasagne[4]和Keras[5]开发的目的是使得更容易表达深度学习模型和训练算法的架构作为由Theano评估的数学表达式。另一个例子是PyMC3,一个概率编程框架,使用Theano以梯度自动导出表达式,并生成快速执行的C代码。 (Keras和Lasagne可在TensorFlow和Theano之上运行。)
Theano在GitHub[6]上有超过25,000个提交,大约300个提交者,已经fork近2000次。
对于视频教程,请观看Martin Andrews的PyCon Singapore 2015讲座:使用Python和Theano让机器学习更深入[7]: 视频地址
TensorFlow[8]是一个使用数据流图进行数值计算的开源库。尽管是开源世界的一个新来者,但这个Google领导的项目在GitHub[9]上已经有近15,000个提交,600多个贡献者,其模型存储库[10]获得12,000个星。
在第一个开源年鉴( Open Source Yearbook[10])中,TensorFlow被选为2016年的一个项目[11]。在最近的开源年鉴中,TensorFlow做了几次出现。我们将该项目列入在我们在2017年必看的顶级开源项目列表[12]中。我们还在Josh Simmons的一篇文章中了解了基于TensorFlow的项目Magenta,这是一篇关于Google 2016年开源版本[13]的文章。Simmons说,Magenta是一个努力,以提高音乐和艺术生成的机器智能的艺术状态,并致力于建立一个由艺术家、编程人员和机器学习研究人员组成的协作社区。Rachel Roumeliotis把TensorFlow分类在驱动人工智能(AI)列表里面,这个列表是她的 2016年度最火编程趋势[14]的一部分。
TensorFlow 1.0在2月中旬推出。Google开发人员博客[15](Google Developers Blog)宣布说:“在刚刚过去的第一年,TensorFlow已经帮助研究人员、工程师、艺术家、学生和许多其他人从语言翻译到早期检测皮肤癌,防止糖尿病患者失明等等每个方面取得进步。”
要了解有关TensorFlow的更多信息,请阅读DZone系列文章的TensorFlow前沿[16]( TensorFlow on the Edge),或观看TensorFlow DevSummit 2017上的直播录像: 视频地址
scikit-learn[17](发音为sy-kit learn)基于NumPy、SciPy和Matplotlib开发,其使用案例[18]有:Spotify工程师使用它来推荐音乐,OkCupid则使用它来帮助评估和改进他们的配对系统,以及Birchbox新产品开发的探索阶段使用它。
在GitHub[19]上Scikit-learn有近22,000个提交和800个贡献者。
有关scikit-learn的免费教程,请阅读其项目网站上的scikit-learn的机器学习介绍[20],或观看Sebastian Raschka的PyData Chicago 2016讲座,学习scikit-learn:Python中机器学习的介绍。[21] 视频地址
[1] https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/ [2] http://deeplearning.net/software/theano/ [3] https://arxiv.org/abs/1605.02688 [4] http://lasagne.readthedocs.org/ [5] https://keras.io/ [6] https://github.com/Theano/Theano [7] https://www.tensorflow.org/ [8] https://github.com/tensorflow/tensorflow [9] https://github.com/tensorflow/models [10] https://opensource.com/yearbook/2015 [11] https://opensource.com/life/15/12/most-likely-succeed-2016 [12] https://opensource.com/article/16/12/yearbook-projects-watch-2017 [13] https://opensource.com/16/12/yearbook-tour-googles-2016-open-source-releases [14] https://opensource.com/article/16/12/yearbook-top-programming-trends-2016 [15] https://developers.googleblog.com/2017/02/announcing-tensorflow-10.html [16] https://dzone.com/articles/tensorflow-on-the-edge [17] http://scikit-learn.org/stable/ [18] http://scikit-learn.org/stable/testimonials/testimonials.html [19] https://github.com/scikit-learn/scikit-learn [20] http://scikit-learn.org/stable/tutorial/basic/tutorial.html [21] https://youtu.be/9fOWryQq9J8