拜师学艺!

拜师学艺!

公众号:尤而小屋
作者:Peter
编辑:Peter

大家好,我是Peter~

今天给大家带来一篇非技术实战的文章,但也和技术有很大的关系,主要给大家介绍下在我 自学数据科学之路 上的 师傅 们,从 操作系统 开始。

操作系统Linux

相信很多人和我一样,一直使用的都是windows的操作系统。由于工作的原因,我接触了Linux系统。最开始用了一小段时间的centos,后面我转向了Ubuntu。

在学习Linux的过程中,接触到了第一位师傅: 刘瑞老师

主要作品《 Linux就该这么学 》,个人站点: linuxprobe.com/

使用的书籍就是:《 Linux就该这么学 》,这本书是基于红帽企业版系统RHEL 8编写而成,但是其内容通用于绝大多数的Linux系统,具有广泛的适用性,也推荐给大家。

或许很多人知道,如果你想真正系统地学习Linux,鸟哥的圣经是不能错过的:《 鸟哥的Linux私房菜 》。鸟哥虽然是环境专业出身,但是在IT领域却有着很大的名气。网上看到过一段鸟哥的简介:

台湾知名 Linux 网站站长,台湾成功大学环境工程系博士,就学期间建立“鸟哥的 Linux 私房菜”网站,其著作《鸟哥的 Linux 私房菜 》是两岸三地最畅销的经典 Linux 入门书,曾任台湾多家知名 Linux 教育中心讲师。
专长是 Linux 操作系统、网站规划与维护、网络安全,研究方向是网络应用整合。

在线学习地址: wizardforcel.gitbooks.io

个人经历介绍: sohu.com/a/155361177_26

为什么要推荐这本书? 知乎一位博主 的回答:

  1. 这本书非常经典,至今仍然蝉联最受欢迎华语Linux书籍第一的位置,无人能撼动;
  2. 非常基础,因为他本身也是从0基础开始自学摸索,所以这本书也是一个循序渐进的过程,带领大家一步步进入Linux世界;
  3. 非常口语化,相较于那些用了大量专业词汇的技术书籍,鸟哥的书真的是更容易为人所接受。

前段时间 人民邮电出版社 的老师给我送了一本(感谢!),书的确是很厚,内容也非常充实!以后有空看了会把笔记整理再发出来。

Python语言

Python的学习资料现在铺天盖地,不过多地介绍。小编最开始在B站也看了些视频,后面觉得还是要看书。使用的是 齐伟老师 一本书:《 跟老齐学Python轻松入门

齐伟 老师是苏州某公司的技术负责人,主要使用Python语言,个人网站: itdiffer.com/

除了Python入门书籍,其作品还有:

另外, 廖雪峰 老师的Python课程也有很多人学习: liaoxuefeng.com/

但是我觉得,廖老师的课程不适合纯小白入门。

爬虫

当你入门了Python,可以尝试进行网络爬虫。爬虫涉及到很多前端的知识,可以参考 w3cshcool HTML JavaScript 的基本知识点过一遍。

学习地址: w3school.com.cn/

曾经也学过一段时间的JavaScript,用的书籍:《JavaScript高级程序设计》,一本红皮书。现在停了~

爬虫的入门师傅是: 崔庆才

他最出名的就是一本书:《Python3网络爬虫开发实战》,得到了 Python之父 的亲笔推荐。图片来自【进击的coder】

崔庆才是北航的硕士,现在微软(北京)工作;除了爬虫,他还涉及到很多其他的方向,具体内容可以查看他站点上的技术栈:

爬虫进阶-咸鱼学Python

如果你想进阶爬虫技术,推荐一个公众号(当然崔庆才大佬也很厉害): 咸鱼学Python 。不知道这个号主是谁,关注很长时间了。

他的爬虫文章全部是进阶性质的,基本上都是和 前端加密 逆向解析 相关的。

数据库-MySQL

结构型数据库MySQL入门,靠的是一门 网易云课程 ,强烈推荐。从环境安装,mysql4种语言,查询,视图,存储过程等,讲解的非常详细,极度适合入门

image-20220814235605564

书籍使用的一本经典书籍:《SQL必知必会》,毋庸置疑的经典好书,看了3遍。f

关于MySQL的练习,推荐两个网站:

  • LeetCode-SQL
  • sqlzoo

数据库-hive

使用的是B站尚硅谷的一门课程: bilibili.com/video/BV1W

Pandas、Numpy

Pandas(numpy)的学习参考了网上一些零零散散的博主,但主要还是靠: 官网,官网,官网 。最好是自己能够总结和多练习。官网学习地址:

pandas.pydata.org/

numpy.org/

小屋里面Pandas目前已经更新的内容:

可视化

我的可视化学习是从一个Python高级可视化库 Plotly 开始的:

公众号里面写过很多关于Plotly绘图的文章,可以参考学习:

Python数据分析

只推荐一本书,也是官方推荐的,中文是:《利用Python进行数据分析》,值得反复看。

Pandas官网主推:

机器学习-课程、书籍

机器学习的入门肯定是跟着 吴恩达老师 ,网易云课程和B站上面都有,经典的入门课程。中文课程是黄海广博士翻译的,他的公众号是【机器学习初学者】,现在是温州大学的教授。

image-20220815000135967

当然还有其他的老师,比如 李宏毅老师、林轩田老师 等。大家可以面向B站学习ML。

书籍推荐4本,不能说入门,但毕竟是经典。看不看都先买吧:

  1. 李航:《统计学习方法》
  2. 周志华:西瓜书《机器学习》
  3. Datawhale开源社区出版的 南瓜书 :《机器学习公式详解》,西瓜书结合看
  4. 《机器学习实战》(很老了,用的还是Python2),实战性很强。

机器学习-博客

除了使用上面的书籍和课程来入门,一直都有关注一个博客园的博主: 刘建平 。不知道为什么刘老师最近不更新了?

博客园地址是: cnblogs.com/pinard/

机器学习-王的机器(公众号)

公众号【王的机器】是新加坡国立大学NUS王圣元大佬的号。以前在学习ML的过程中拜读了很多他的文章,从Pandas、可视化到ML等。

他写了一本书:《快乐机器学习》,感兴趣地可以看看。大陆和台湾的两个版本都有

NLP

关于NLP,小编没有深入学习,并非专业的,但是在网上有幸了解到了一位博主: 何晗 ,可以说是他让我初步接触到了NLP。

他本身是上海外国语大学日本文化经济学院学习日语的,后面很神奇地转向了算法和NLP。主要作品就是开发了HanLP这个语言处理包,GitHub地址: github.com/hankcs/HanLP

HanLanguage Processing,缩写为HanLP,这是一款以中文分词为主,关键词提取、简繁转换等功能为辅的汉语言处理包。它具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

个人站点: hankcs.com/ ,码农场。下面是他网站的个人简介:

算法初心者。
白天生存,晚上生活。
没有任何光鲜的经历,也没有任何过去的回忆。无论是互联网还是现实中,都不会保留任何“过去”的东西。
喜欢有思想深度的事物,讨厌浮躁、拜金与安逸的人。
对外面的世界失去了兴趣,希望一直活在“心境”里。
img

如果你是做NLP的,能够评价下这个工具?

职场导师-Jackson

最后再说一位: Jackson

Jackson是我刚毕业那会在网上搜索内容的时候认识的一位网友。他在深圳某公司做服务器开发,主要使用Python和Go。

那个时候刚学Python,向他请教了很多关于Python的问题。虽然他不做数据,但是他教会了我工作或者说作为技术人的3点:

1、要独立思考

2、工作多总结

3、善用搜索引擎

写在最后

现在互联网学习技术的资源很多,多向大佬们学习,面向网络和大佬们编程,有空还是多学习下:

  • GitHub
  • B站
  • 油管
  • 各种课程

技多不压身是句大实话 。最后:感谢各位 师傅

发布于 2022-08-15 23:53