最近在利用业余时间学习机器学习,期间搜集整理了不少学习资料,多为斯坦福 / 康奈尔等大学的公开课和讲座,以及机器学习领域的英文原版书籍。私以为,相比国内各大社区里出处不明的入门教程,还是一手的权威资料讲得更加深入和准确,所以,何不食肉糜呀!
另外,机器学习领域大牛很多,领域很广,应用更是广阔到难以尽数,作为一个 ML 小白,这篇文章的内容也并不会多完备,不求尽善尽美,只是抛砖引玉,一起交流学习。
1. 计算机基础
-
python 入门:
- Introduction to Python
-
Java 入门:
- Introduction to Java
-
算法:
- Coursera specialization
-
数据库:
- Stanford archived DB course
- Using Database with Python
-
离散数学:
- Coursera Discrete Math specialization
-
操作系统:
- 《Modern Operating Systems》
- 《Modern Operating Systems》
2. 数学和统计基础
- 线性代数(Linear algebra)【必须】
- 微积分(Calculus)【必须】
- 优化(Optimization)【必须】
- 基础统计(Statistics)【必须】
- 实分析和泛函(real analysis, functional analysis)【非必须】
3. 入门
- 机器学习入门:吴恩达的这个课可能没有人不知道了
- 《统计学习导论》:这本书里面的编程很轻量,但是作为直觉培养和思路练成,仍然是不错的
- 深度学习入门:吴恩达的这个课用来入门深度学习也不错
- 人工智能入门:Udacity 的第一门旗舰 AI 课,基于斯坦福大学的一门本科生课程,会涉及一点比前几门入门课更宽广的概念
4. 进阶
- [挖掘海量数据集
](http://web.stanford.edu/class…:之前的几个课程主要是讲监督学习的,这门斯坦福的课程稍微宽广一点,并不完全是机器学习,但是对扩大知识面和实践有帮助
- 高级机器学习:康奈尔大学的机器学习课程,可惜没有录像,只有课件,关于实战的部分讲的还是不错的
- 《The Elements of Statistical Learning》:经典 ESL
- 《Pattern Recognition and Machine Learning》:经典书
5. 应用
-
信息提取和搜索
- https://www.searchtechnologies.com/blog/relevancy-ranking-301
- http://web.stanford.edu/class/cs276/
- UIUC 课程幻灯片
-
推荐系统
-
Recommender Systems: The Textbook
-
Recommender Systems: The Textbook
-
图像识别
- stanford CS231n:Andrej 版的堪称经典
-
自然语言处理
- stanford CS224n
-
加强学习
- 《Deep Learning (Adaptive Computation and Machine Learning series)》:经典课本
- 《Deep Learning (Adaptive Computation and Machine Learning series)》:经典课本
-
无人车
- MIT 自动驾驶课程
- Cruise 2017 年的演讲
- 百度 Apollo
- MIT 2019 最新总结
6. 框架
- Tensorflow:https://www.youtube.com/channel/UC0rqucBdTuFTjJiefW5t-IQ
- Pytorch:https://course.fast.ai/
- Caffe
7. 扩展注意事项
数据量大了会面临的问题,一些最最小白的介绍,大佬可跳过
-
分布式系统:
- https://hackernoon.com/a-thorough-introduction-to-distributed-systems-3b91562c9b3c
- https://www.youtube.com/watch?v=BkSdD5VtyRM
-
系统设计
- https://www.educative.io/collection/5668639101419520/5649050225344512?affiliate_id=5749180081373184/
-
https://www.amazon.com/Designing-Data-Intensive-Applications-Reliable-Maintainable/dp/1449373321/ref=as_li_ss_tl DDIA 堪称经典教程
-
分布式 OLTP 和 OLAP
- https://www.youtube.com/watch?v=tcyDgOejU5g
- https://www.youtube.com/watch?v=AoK8_QEi5U0
8. 机器学习系统和平台
-
什么是机器学习系统?
- https://ai.google/research/pubs/pub43146
- https://ai.google/research/pubs/pub46555
- Adv ML systems 没有录像只有幻灯片
- 《Building Intelligent Systems – A Guide to Machine Learning Engineering》
- NIPS2018
-
机器学习平台
-
Google:
- tfx https://www.tensorflow.org/tfx/
- KDD talk https://www.kdd.org/kdd2017/papers/view/tfx-a-tensorflow-based-production-scale-machine-learning-platform
-
Facebook:
- FB Learner flow [https://code.fb.com/ml-applications/introducing-fblearner-flow-facebook-s-ai-backbone/](https://code.fb.com/ml-applications/introducing-fblearner-flow-facebook-s-ai-backbone/)
-
Uber:
- Michelangelo [https://eng.uber.com/scaling-michelangelo/](https://eng.uber.com/scaling-michelangelo/)
- 深度学习 Horovod https://eng.uber.com/horovod/
-
linkedin:
- Pro ML https://twimlai.com/twiml-talk-200-productive-machine-learning-at-linkedin-with-bee-chung-chen/
-
Airbnb:
- Bighead https://databricks.com/session/bighead-airbnbs-end-to-end-machine-learning-platform
- Podcast TwimlAI https://twimlai.com/shows/
-
安利时间
我们在 web 开发过程中,都见过或者使用过一些奇技淫巧,这种技术我们统称为黑魔法,这些黑魔法散落在各个角落,为了方便大家查阅和学习,我们做了收集、整理和归类,并在 github 上做了一个项目——awesome-blackmargic,希望各位爱钻研的开发者能够喜欢,也希望大家可以把自己的独门绝技分享出来,如果有兴趣可以给我们发 pr。
欢迎加入我们的 QQ 群(784383520),一起交流学习。