何不食肉糜-机器学习自学指南

38次阅读

共计 2967 个字符,预计需要花费 8 分钟才能阅读完成。

最近在利用业余时间学习机器学习,期间搜集整理了不少学习资料,多为斯坦福 / 康奈尔等大学的公开课和讲座,以及机器学习领域的英文原版书籍。私以为,相比国内各大社区里出处不明的入门教程,还是一手的权威资料讲得更加深入和准确,所以,何不食肉糜呀!

另外,机器学习领域大牛很多,领域很广,应用更是广阔到难以尽数,作为一个 ML 小白,这篇文章的内容也并不会多完备,不求尽善尽美,只是抛砖引玉,一起交流学习。

1. 计算机基础

  • python 入门:

    • Introduction to Python
  • Java 入门:

    • Introduction to Java
  • 算法:

    • Coursera specialization
  • 数据库:

    • Stanford archived DB course
    • Using Database with Python
  • 离散数学:

    • Coursera Discrete Math specialization
  • 操作系统:

    • 《Modern Operating Systems》

2. 数学和统计基础

  • 线性代数(Linear algebra)【必须】
  • 微积分(Calculus)【必须】
  • 优化(Optimization)【必须】
  • 基础统计(Statistics)【必须】
  • 实分析和泛函(real analysis, functional analysis)【非必须】

3. 入门

  • 机器学习入门:吴恩达的这个课可能没有人不知道了
  • 《统计学习导论》:这本书里面的编程很轻量,但是作为直觉培养和思路练成,仍然是不错的
  • 深度学习入门:吴恩达的这个课用来入门深度学习也不错
  • 人工智能入门:Udacity 的第一门旗舰 AI 课,基于斯坦福大学的一门本科生课程,会涉及一点比前几门入门课更宽广的概念

4. 进阶

  • [挖掘海量数据集

](http://web.stanford.edu/class…:之前的几个课程主要是讲监督学习的,这门斯坦福的课程稍微宽广一点,并不完全是机器学习,但是对扩大知识面和实践有帮助

  • 高级机器学习:康奈尔大学的机器学习课程,可惜没有录像,只有课件,关于实战的部分讲的还是不错的
  • 《The Elements of Statistical Learning》:经典 ESL
  • 《Pattern Recognition and Machine Learning》:经典书

5. 应用

  • 信息提取和搜索

    • https://www.searchtechnologies.com/blog/relevancy-ranking-301
    • http://web.stanford.edu/class/cs276/
    • UIUC 课程幻灯片
  • 推荐系统

    • Recommender Systems: The Textbook
  • 图像识别

    • stanford CS231n:Andrej 版的堪称经典
  • 自然语言处理

    • stanford CS224n
  • 加强学习

    • 《Deep Learning (Adaptive Computation and Machine Learning series)》:经典课本
  • 无人车

    • MIT 自动驾驶课程
    • Cruise 2017 年的演讲
    • 百度 Apollo
    • MIT 2019 最新总结

6. 框架

  • Tensorflow:https://www.youtube.com/channel/UC0rqucBdTuFTjJiefW5t-IQ
  • Pytorch:https://course.fast.ai/
  • Caffe

7. 扩展注意事项

数据量大了会面临的问题,一些最最小白的介绍,大佬可跳过

  • 分布式系统:

    • https://hackernoon.com/a-thorough-introduction-to-distributed-systems-3b91562c9b3c
    • https://www.youtube.com/watch?v=BkSdD5VtyRM
  • 系统设计

    • https://www.educative.io/collection/5668639101419520/5649050225344512?affiliate_id=5749180081373184/
    • https://www.amazon.com/Designing-Data-Intensive-Applications-Reliable-Maintainable/dp/1449373321/ref=as_li_ss_tl DDIA 堪称经典教程
  • 分布式 OLTP 和 OLAP

    • https://www.youtube.com/watch?v=tcyDgOejU5g
    • https://www.youtube.com/watch?v=AoK8_QEi5U0

8. 机器学习系统和平台

  • 什么是机器学习系统?

    • https://ai.google/research/pubs/pub43146
    • https://ai.google/research/pubs/pub46555
    • Adv ML systems 没有录像只有幻灯片
    • 《Building Intelligent Systems – A Guide to Machine Learning Engineering》
    • NIPS2018
  • 机器学习平台

    • Google:

      • tfx https://www.tensorflow.org/tfx/
      • KDD talk https://www.kdd.org/kdd2017/papers/view/tfx-a-tensorflow-based-production-scale-machine-learning-platform
    • Facebook:

      - FB Learner flow [https://code.fb.com/ml-applications/introducing-fblearner-flow-facebook-s-ai-backbone/](https://code.fb.com/ml-applications/introducing-fblearner-flow-facebook-s-ai-backbone/)
      
    • Uber:

      - Michelangelo [https://eng.uber.com/scaling-michelangelo/](https://eng.uber.com/scaling-michelangelo/)
      • 深度学习 Horovod https://eng.uber.com/horovod/
    • linkedin:

      • Pro ML https://twimlai.com/twiml-talk-200-productive-machine-learning-at-linkedin-with-bee-chung-chen/
    • Airbnb:

      • Bighead https://databricks.com/session/bighead-airbnbs-end-to-end-machine-learning-platform
      • Podcast TwimlAI https://twimlai.com/shows/

安利时间

我们在 web 开发过程中,都见过或者使用过一些奇技淫巧,这种技术我们统称为黑魔法,这些黑魔法散落在各个角落,为了方便大家查阅和学习,我们做了收集、整理和归类,并在 github 上做了一个项目——awesome-blackmargic,希望各位爱钻研的开发者能够喜欢,也希望大家可以把自己的独门绝技分享出来,如果有兴趣可以给我们发 pr。

欢迎加入我们的 QQ 群(784383520),一起交流学习。

正文完
 0