关于人工智能:六个月的机器学习-计算机视觉工程师

作者|Richmond Alake
编译|Flin
起源|towardsdatascience

介绍

我真不敢相信，离我写第一篇详细描述了我第一天的职业生存的文章曾经有六个月了。

工夫过得真快。

所以，欢送再次光顾我作为计算机视觉工程师的在线日志。

在这篇文章中，你能够看到一个计算机视觉工程师在一个初创企业中的日常流动的许多细节。同时也心愿我能回忆起我犯过的一些谬误和我所庆贺的成就。

对于你来说，这篇文章将介绍当你在初创公司中负责机器学习/计算机视觉的角色时，会遇到的状况，以及以后机器学习从业者的典型角色和职责。

我认为这是一个足够好的介绍。

让咱们间接跳进去，用4000字或更少的话来总结这六个月。

机器学习/计算机视觉/深度学习

让咱们先把我的角色合成一下，再加上职位形容。

在本节中，我还将向你准确介绍对计算机视觉工程师的冀望。

机器学习能够简略地说就是开发可能从数据中学习和改良的零碎。

计算机视觉是一个机器或零碎通过调用一个或多个算法对所提供的信息产生了解的过程。这种了解被转化为决策、分类、模式察看等等。

深度学习是利用深度卷积神经网络来解决计算机视觉工作，如图像分类、姿势预计、语义宰割等。

我的主要职责在于钻研和施行计算机视觉技术，例如姿态预计，语义宰割，手势辨认和面部特色检测。所有列出的技术都在挪动设施上实现。

技巧

以下是我在过来六个月中应用深度学习解决方案实现的各种计算机视觉技术。
在某些状况下，我包含了曾经应用的模型：

姿态预计：这是对图像或视频中显示的人的要害关节地位的预计。我利用诸如重叠沙漏，卷积姿势机（CPM）和Posenet之类的钻研解决方案来实现姿势预计。

重叠沙漏：https://arxiv.org/abs/1603.06937
卷积姿势机（CPM）：https://arxiv.org/abs/1602.00134
Posenet：https://www.tensorflow.org/li…

手势辨认：人采取的动作的分类能够称为流动或手势辨认。我实现该技术的过程是通过迁徙学习利用MobileNetV2网络（在imagenet上训练），并应用定制的分类头对图像中的手势进行适当分类。

MobileNetV2网络：https://arxiv.org/abs/1801.04381

手检测/跟踪：这是一项琐碎的计算机视觉工作，次要波及图像或视频中手的检测和定位。

语义宰割：这能够看作是在像素级别实现的粒度分类，因为咱们正在将图像中的每个像素分类为一个对象。实现这一过程很乏味，并且波及到TensorFlow的DeepLabV3宰割示例的逆向工程。

DeepLabV3：https://arxiv.org/abs/1706.05587

人脸检测/跟踪：这是一个零碎的实现，能够跟踪和定位在图像或视频中的人脸地位。

工具类

如果你是机器学习的从业者，你可能晓得以下提到的一些工具。对于刚刚进入AI畛域的人，数据科学家，ML Researchers和ML Engineers都应用列出的工具。

这些是我每天应用的工具。

TensorFlow：一个用于施行，训练和部署机器学习模型的开源平台。

TensorFlow：https://www.tensorflow.org/

Keras：一个凋谢源代码库，用于实现在CPU和GPU上运行的神经网络体系结构。

Keras：https://keras.io/

TensorFlow Lite：一个凋谢源代码框架，旨在在智能手机等边缘设施上部署机器学习模型。

TensorFlow Lite：https://www.tensorflow.org/lite

其余值得注意的工具：

Jupyter Lab：https://jupyter.org/
Anaconda：https://anaconda.org/anaconda…
CoreML：https://developer.apple.com/m…
Vision Framework：https://developer.apple.com/d…
Visual Studio：https://code.visualstudio.com/

提醒：不要专一于工具，技术和流程。应该专一于你疾速学习和适应新环境的能力。

软件工程

以前我认为软件工程是一种技能，但随着我职业生涯的倒退，我逐步承受了这样一个事实：软件工程更像是一种实际。

软件工程不是一项你能够在三个月内取得的技能，但它是一种办法，你能够通过多年的软件应用开发教训来开发。

作为一名机器学习工程师，我每天都在实际软件工程。更具体地说，我将软件工程原理的各个方面纳入我的开发工作流程和过程中。

大多数古代机器学习工程师都有3+编程语言的良好常识。这看起来仿佛很多，而应用集成学习零碎和ML技术构建古代应用程序须要各种平台和工具之间的协同作用，所有这些平台和工具都利用不同的编程语言编写可执行指令。

以下是我过来六个月应用的次要编程语言：

Swift：用于iOS利用程序开发
- https://developer.apple.com/s…
Python：用于ML模型的实现、训练和评估
- https://www.python.org/
JavaScript：用于实现ML模型，也能够编写自定义脚本。
- https://developer.mozilla.org…

我还把握了HTML、CSS、SQL、Kotlin、NodeJS、Flask等实用常识，这些都是三年来通用软件工程所学的工具和语言。

提醒：学习OOP（面向对象编程）的基本原理。OOP的常识在宽泛应用的编程语言中是可利用和可转移的。

如果你理解OOP，学习编程语言就是相熟特定语言的语法。

新冠病毒

没有人能预测到2020年会有一场全球性大流行病，使全世界的国家陷入瘫痪。厕纸在东方国家成了一种商品；肘部问候取代了握手，近程工作当初成为大多数科技型行业的新标准。

大风行蔓延到英国时，我才刚刚上任一个月，而后咱们进入了封闭状态。

近程工作并没有扭转守业公司的指标，团队能源和实现工作的雄心。身为计算机视觉工程师，并领有大量基于技术的职位，这意味着我能够在任何中央通过Internet连贯工作。

有助于近程工作的事件：

购买台灯：这是我最近购买的货色，对此我感到十分称心。我读了很多书，深夜编码/写作会议变得十分频繁。因而，领有良好的人造光源对于浏览时的可见度和整体生产率十分有帮忙。
- https://www.amazon.co.uk/TaoT…
Zoom：这可能是2020年最受关注的视频会议工具。Zoom以其同行所没有的形式创立了无缝的虚构缺席状态扩大。我以与共事进行的缩放会议开始新的一天，并以与敌人举办的缩放团聚完结我的夜晚。
- https://zoom.us/
TeamViewer：出门在外时，TeamViewer可让我从我的GPU机器拜访计算资源。
- https://www.teamviewer.com/en/
反馈迅速的团队：让团队成员发送 Slack音讯或Zoom呼叫，能够打消由大风行引起的差距。我遇到的任何问题都只是解决方案中的一条小音讯。
- https://slack.com/intl/en-gb/

有人说，近程工作将成为员工的永恒抉择。显然，公司自身在办公空间上节俭了很多钱，并且公司团队没有显著不足生产力或成绩。

硬件

当我写我作为计算机视觉工程师的第一个月的文章时，我写了一项调配给我的具体任务，那就是购买GPU工作站。

通过艰辛的钻研以及与美国和英国的GPU提供商公司的来回交换后，我终于购买了一个。

在过来的五个月中，我利用GPU计算资源间断数天训练定制模型。因为工作站领有14个CPU内核，我还执行了能够并发运行的脚本，而没有任何问题。

提醒：即便你可能只购买一个理论的GPU，也请确保购买具备多个GPU插槽的GPU工作站。在可预感的未来，你可能须要扩大GPU性能，因而最好为此做好筹备。

我对GPU的历史以及它们的倒退变得有点趣味。作为一名深度学习从业人员，咱们都晓得，随着AlexNet的推出和深度卷积神经网络的呈现，应用GPU训练CNN变得很风行。

我可能会写一篇对于GPU的历史以及无关其利用率和壮举的其余乏味事实的文章。

学习/钻研

在与ML相干的职业中学习永远不会完结。AI畛域自身的倒退步调总是有新的倒退须要留神（以后是GPT-3的公布）或要施行的新技术。

回顾过去的六个月，我真的感到本人仍在重返大学。实现“ 9-5”工作后，我回到家中浏览钻研论文，撰写论文并施行ML模型。

对于那些心愿从事机器学习事业的人来说，你必须意识到，有一个显而易见的冀望，能够让你理解最新的AI开发信息。大多数人心愿你比普通人更理解新的人工智能应用程序版本。

目前，我将学习尽可能多的实际和理论知识，而后再着手实现我的神经网络体系结构或批改DCNN的子组件。

我永远不会百分百理解要施行的CV技术。在我思考任何模式的实现之前，通常有一个宽泛的钻研期。对于我正在钻研或施行的每一项新技术，大概70%的内容对我来说都是新的。

学习永无止境。

提醒：不要胆怯退后一步，而要时常复习以确保你建设了松软的学习根底。最近，与深刻理解最新的神经网络体系结构相同，我回顾了深度学习晚期公布的钻研论文。

恐怖

如果我通知你在过来的六个月里我没有质疑我的能力，那我就是在骗你。

这是我的第一个与ML相干的角色，更可怕的是我是公司第一个机器学习型员工。

你据说过冒名顶替综合症吗？

这是一种能干和不充沛的感觉，即便你做得很好。这是自我狐疑、缺乏自信和虚伪的智力坑骗的混合体，它们会偷走你的胜利和成就。

在过来的六个月里，我发现自己总是在问以下问题：

我走得够快吗？我够好吗？我够聪慧吗？我晓得的够多吗？够好吗？如果我失败了怎么办？如果我错了怎么办？

这是对于冒名顶替综合症的问题；它能够是消极的，也能够是踊跃的，这都取决于你采取的口头，以及你抉择如何打消你的自我狐疑。

我利用我的“冒名顶替者综合症”来确保我在游戏中处于最佳状态，我没有被它减弱。

冒名顶替综合症比你设想的要广泛，即便是最平凡的人也会蒙受这种病的折磨。

“我毕生的工作受到过分的尊重，这使我感到十分不安。我认为本人是一个不盲目的骗子，我感觉本人曾经完蛋了

ML社区

我在工作之外所做的工作与我在工作中所做的工作同样重要。

在过来的六个月中，我意外地开始在AI社区中建设集体品牌。通过几个不同的在线平台，我每天能够分割到成千盈百的人。

我认为你能够并且应该这样做。

以下是我用来在ML社区中建设影响力的平台的摘要。

Medium

在我的学术研究和当初的职业生涯中，Medium上与AI相干的内容始终是重要的信息起源。

我曾经浏览了简化简单的神经网络架构钻研论文的文章；以及提供了无关如何在AI行业进行工作抉择或薪资会谈的有用倡议的文章。

在2019年冬季，我决定不仅要成为Medium内容的消费者，而且要成为创作者。我不晓得会产生什么，然而我有一个指标。

我的指标是应用Medium作为一种工具，以增强我通过学习和我的项目取得的常识和信息。对我而言，Medium是保留常识的一种模式。

对我而言，当初是一个平台，使我每天都能接触到成千上万的人。我曾经写了70多篇对于AI和ML的文章，我看到很多人都受到我写作的启发，正在学习并拿走一个可行的我的项目。

我（因为某种原因）被公认为以下主题的顶级作家之一：人工智能，技术和教育。实际上，这是我心愿可能保留的荣誉。

我不记得我首次建设LinkedIn帐户的初衷，然而我能够说的是，与任何其余年份相比，我应用LinkedIn的次数比2020年要多。

相当多的人浏览了我的作品，有些读者对我文章中的内容有疑难。LinkedIn是分割我的传统办法之一。

我十分乐于答复任何问题，并就我的技术特长范畴内的主题提供任何倡议。到目前为止，我曾经答复了大概50多个通过LinkedIn与我分割的集体的问题。我也花了一些工夫与集体进行视频电话会议。我收到的一些问题须要更宽泛的答案。

我被问到的大多数问题都围绕着学习机器学习的最佳办法，或者是走哪条职业路线。只管我不是专家，但我很快乐分享我通过学习，钻研和教训中学到的常识。

如果你想给我发音讯或探讨与ML相干的问题，请点击这里。

https://www.linkedin.com/in/r…

征询

在过来的六个月里，我和一些寻求我的项目倡议的人坐在一起，在一些状况下，我失去了相应的报酬。当初，我的薪水并没有扭转我的生存，我也不会很快成为一名全职参谋。事实上，人们只看重我的专业知识，这一事实对我来说依然是疯狂的。

除了征询工作，我最近还被邀请成为一本行将出版的计算机视觉书籍的技术作者。这个机会仿佛好得令人难以置信，但我明天就在这里，进入这本尚未出版的书的几个章节。

除了我的学习和事业，我无奈预测我会遇到什么样的机会。每个月都不一样。

YouTube

我很观赏AI / ML YouTube频道，主持人在那里传授与机器学习相干的话题，或者解释和施行钻研论文中介绍的技术。

当然，我是Alex Fridman的播客和YouTube频道的粉丝。

在YouTube上，我是一位消费者，并且关注与ML相干的渠道，例如：

Two Minutes Paper：https://www.youtube.com/chann…
Daniel Bourke：https://www.youtube.com/chann…
Sentdex：https://www.youtube.com/user/…
Deep Lizard：https://www.youtube.com/chann…
3Blue1Brown,：https://www.youtube.com/chann…
Yannic Kilcher：https://www.youtube.com/chann…
Abhishek Thakur ：https://www.youtube.com/chann…

我决定开始在YouTube平台上构建。很快，我将公布一些我认为对机器学习/深度学习入门者有用的内容。

随时在这里订阅我的频道（https://www.youtube.com/chann…）。

提醒：不要胆怯扩大范围。让世界晓得你的存在。

我犯的谬误

在过来的六个月中，我犯的谬误数量是无奈计数的。

这里有一些“不太”令人难堪的谬误。

没有推送我的git repo并失去了两个星期的工作量。
对我的工作体现出不耐烦的态度，这导致了很多谬误和bug。
我真正须要时不寻求帮忙。
装有电子设备的团队书桌上洒满了水。
星期五开始生产。而后花了整个周末修复bug。
即便我在家工作，我加入在线会议也早退了（此谬误须要肯定程度的技能，哈哈）。

每个人都会犯错误；谬误是不可避免的。重要的是，你要从犯下的谬误中吸取教训，并记住本人的谬误并不能定义本人。

我敢肯定，在接下来的六个月中，我还会犯更多的谬误。

年度愿景

简而言之，六个月。

总结六个月，并在接下来的一年中，我将与你分享我为本人设定的指标。

这些指标次要是为了让我在事业、集体和学术倒退上放弃正规。列出的一些指标是不置可否的，我很可能会在当前欠缺它们。

在年底之前浏览10篇钻研论文
在线公布两个基于AI的应用程序
在边缘设施上施行更多的计算机视觉技术
在ML社区中建设更弱小的影响力
建设牢固的集体品牌
取得每个人都热衷的TensorFlow证书
- https://www.tensorflow.org/ce…

原文链接：https://towardsdatascience.co…

欢送关注磐创AI博客站：
http://panchuang.net/

sklearn机器学习中文官网文档：
http://sklearn123.com/

欢送关注磐创博客资源汇总站：
http://docs.panchuang.net/

关于人工智能:六个月的机器学习-计算机视觉工程师

介绍

机器学习/计算机视觉/深度学习

技巧

工具类

软件工程

新冠病毒

硬件

学习/钻研

恐怖

ML社区

Medium

LinkedIn

征询

YouTube

我犯的谬误

年度愿景

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于人工智能:六个月的机器学习-计算机视觉工程师

介绍

机器学习/计算机视觉/深度学习

技巧

工具类

软件工程

新冠病毒

硬件

学习/钻研

恐怖

ML社区

Medium

LinkedIn

征询

YouTube

我犯的谬误

年度愿景

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复