关于java:机器学习自学成才的十条戒律

25次阅读

共计 2951 个字符,预计需要花费 8 分钟才能阅读完成。

在机器学习技能自学成才的过程中,咱们必须对本身的教育和启蒙负责。本文列出了十条不应漫不经心的戒律。前事不忘; 后事之师,后车之师。

1. 数学、代码和数据是“三位一体”的

任何卓有成效的机器学习流水线,都是数学、编程和数据的三位一体。三个方面等同重要。

  • 如果数据品质不高,那么数学公式再丑陋,代码再高效,也于事无补。
  • 即使有了高质量的数据,但如果咱们对数学无所不通,那么就会给出令人悲观,甚至是背道而驰的后果。
  • 即使具备世界一流的数学根底和数据,然而面对低效的编程代码实现,咱们仍然无奈实现大规模的收益。

数据提供了一处富含人造珍宝的矿场,数学就是开掘工具,而编码则提供了一队挖掘机。

数学、编程和数据的“三位一体”,形成了零碎输出(即手头具备的数据)和输入(即冀望的后果)之间的桥梁。

留神:数学还蕴含统计学和概率论等分支,因而你能够把“三位一体”想成是一只海星。

2. 在三者之外,还需思考具体需要

除了思考如何在三位一体上获得均衡,还需谨记三者的最终服务对象是客户需要。如果无奈向客户提供服务,那么即使有执行最好的代码、最齐备的数学实践和对数据最丰盛的洞察,也于事无补。

工程人员经常沉迷于具体的过程,而漠视了最终产出。即便出发点再好,也不应遗记理论成绩并不取决于出发点。

哪怕咱们并未向客户提供很好的性能,也要好过那些根本无法给出任何体现的解决方案。

举个例子,如果一个最先进的模型需额定运行 47 倍的工夫,最终实现了精度进步 1%的成果,这对客户是否提供了最佳的体验?

3. 不要被“三位一体”蒙蔽

即便咱们十分推崇三位一体,但也不要被感情蒙蔽了所有。

自学成才的机器学习工程师,本身就是最大的怀疑论者。

他们晓得数据自身并无奈去确认某事,但能够用于颠覆某事。例如,在十亿个数据点中只有有一个异样点,就能证实先前确认某个重要的理念是谬误的。大自然并非线性的,在数学上的一点缺点,就会导致重大的结果。而代码的性能则取决于其最单薄之处。

无论三位一体如许齐备,都不应漠视本人的直觉。一旦后果仿佛过于完满,让你狐疑其中可能有问题,那么事实上就是如此,除非咱们确实很侥幸。

4. 保护与潜在客户的关系

让机器去实现其所善于的工作,即实现重复性操作。人们应该去做本人所善于的,包含关心、同理心、质疑、凝听、领导和教学等。

客户并不像咱们那样关注数学、编程和数据,而是关怀本人的需要是否失去满足。

对于数据伦理等简单问题时,须要从“道德银律”(Silver Rule)的角度扫视,即“己所不欲,勿施于人”。

5. 尊敬前行者的工作

提及计算迷信、机器学习、人工智能、数学,咱们可能立即会想到 Ada Lovelace、Geoffrey Hinton、Yann LeCun、Yoshua Bengio、阿兰·图灵、李飞飞、Grace Hopper、吴恩达、冯·诺伊曼、Alan Kay、Stuart Russel、Peter Norvig 等前行者。

当然,除了上述耳熟能详的人物,还有数千位做出奉献的人并未被铭刻。

锋芒毕露的老手,应该知悉各位前行者所做出的巨大贡献。同时也应该意识到,对于每一位机器学习老手,前辈们都对咱们有着统一的冀望,就是这一畛域的将来取决于各位当下的致力。

6. 颠覆重来的效用不可低估

咱们的指标是在第一工夫给出牢靠的解决方案。随着技能的进步,咱们会从新扫视原先的工作,打破旧世界,从新的视角从新构建。

对于自学成才的机器学习工程师,应该意识到和自然界一样,软件和机器学习我的项目同样是生生不息的,处于一直的倒退中。数据会一直变更、代码也会在新硬件上执行。还有,一位数学蠢才提出了称为“Adam”的优化器,它实用于大型数据集的无效计算,占用内存资源更低。

对变动咱们应秉持凋谢的态度,去欢送它们。一旦发生变化,咱们就应答是否适宜施行给出最好的判断。变动仅是一些新事物,但并不意味着是必须的。

7. 不要成为工具的奴隶

编程界的一个罕用隐喻是自行车棚刷漆问题。它指的是程序开发人员或团队在放心一个自行车棚应该刷成什么色彩,而不是该车棚是否能够理论寄存自行车这样的重要问题。

当然,这里自行车棚对应的是面向具体用处的计算机程序。

在机器学习畛域,咱们能听到许多无休止的争执,R 还是 Python、TensorFlow 还是 PyTorch、读书自学还是报班教学、数学优先还是代码优先,Spark 还是 Hadoop、Amazon Web Services 还是 Google Cloud Platform,VSCode 还是 Jupyter、英伟达还是其它等等。事实上,并不存在相对正确的抉择。

所有选项均实用,没有必要争个高下之分。

咱们真正须要去答复的问题是:哪种选项能最快、最牢靠地实现咱们的想法?

一旦思考及此,咱们会发现所有的人都在思考着同样的问题。

工程人员的一个最大问题,就是经常会从工具动手去寻找问题,而不是从发现问题开始,再去寻找工具。在面对问题时,如果没有适合的工具,那么就须要去构建工具。

对教育资源同样如此。无论采纳何种学习形式,数学,代码和数据是不变的,关键在于如何应用它们。

谨记,很多问题其实并不需要机器学习的染指。

8. 想法同样有交换的价值

不要混同想要窃取你想法的人和想要遵循你想法做事的人。一个想法可能对于别人的价值要比对你而言大得多。

作为一名工程人员,咱们的作用不仅是去构建本人的想法,而且还应该与别人进行交换,阐明该想法如何能令别人同样从中受害。如果咱们不足这种交换能力,那么就去找具备或无意推动本身交换能力的人搭档。

身处真伪难辨的社会中,真挚会使咱们胜出。应恳切地让别人理解本人工作所能提供的,以及本人所不晓得的。抵赖本人的有余是一种劣势,而非劣势。

好的技术将永立不败之地,谎话却并非如此。多做技术少吹牛。

9. 同台竞争

看到他人的提高,咱们会嫉妒吗?还是视其为潜在的工作灵感?

咱们对别人胜利的感触,也是咱们对本身胜利的感触。

10. 切忌贪婪

咱们致力去具备使用数学、数据和编程为指标客户提供解决方案的能力,但不应对此过于奢求。欲望会令人对将来冀望过高,而不是去享受当初的生存。

放弃学习的激情,是解决奢求技能进步的良药。

通过自学成才的机器学习工程师,能够疾速地去把握驾驭数学、编程和数据所需的常识,但千万不要存在急躁情绪。需明确,学习把握任何有价值的技术都须要工夫。由此,乐趣在于过程之中。

咱们一旦开始自学,就须要齐全承当起本身的启蒙和教育责任。在抉择我的项目上不应寄希望于撞大运,而是应审慎遴选。我的项目是否能满足本人的求索心?是否会挑战本人现有的技能?是否能够让你遵循准则?如果答案是必定的,那么就够了。

最初一点,自学成才者应走出一条适宜本身的路线,永立于潮头:

  • 夯实常识,再去谋求证书。
  • 扎实做事,不要适度空想。
  • 寓教于乐。
  • 自成一家。
  • 实际出真知。
  • 明确各工具的目的性。
  • 在交付前,不要吹牛。
  • 心存质疑,并提出假如。
  • 巧妇难为无米之炊。
  • 立足当初,筹划久远。

万变不离其宗,机器学习的最重要根底是数学、编程和数据。

 原文链接:https://www.infoq.cn/article/…

看完三件事❤️

========

如果你感觉这篇内容对你还蛮有帮忙,我想邀请你帮我三个小忙:

点赞,转发,有你们的『点赞和评论』,才是我发明的能源。

关注公众号『Java 斗帝』,不定期分享原创常识。

同时能够期待后续文章 ing????

正文完
 0