论 AI 圈活菩萨,非李沐老师莫属。
前有编写「入手学深度学习」,成就圈内入门经典,后又在 B 站收费讲斯坦福 AI 课,一则艰深硬核讲论文的视频播放量 36 万,不少课题组从导师到见习本科生都在追番。
如此给劲的分享,难怪不少人自豪自称「已拜在老师门下」——
而最近,我发现有平台干了个更给劲的事。
这个平台无偿提供算力不说,还将入门经典「入手学深度学习」放进平台,收费供大家学习和实操,名曰:Amazon SageMaker Studio Lab。
按介绍说法,该平台基于 JupyterLab,提供收费 GPU 和 CPU 算力 +15G 永恒存储性能,还与 GitHub 链接,反对支流机器学习工具组件和开源资源包应用,开发者可联合「入手学深度学习」教材自行训练模型、看后果。
而且,他们还号称申请只需一个邮箱,不要官网账号,更不必填什么信用卡。
真有这么好的事?
明天就带着大家一起亲测试试。
真能实操「入手学深度学习」案例?
通过链接 studiolab.sagemaker.aws,咱们即可登入 web 端平台,探探虚实。
-
哪能找到「入手学深度学习」?
从界面能看到,平台提供 GPU/CPU 算力抉择,而且,可间接开启应用,的确无需付款。
右下角,咱们就能看到那本 Dive into Deep Learning (缩写为 D2L)。
间接点击 Open D2L notebooks 可关上:
开启我的项目后,零碎主动加载 D2L 资源,并存储在咱们的云上文件夹中。
README 文件也一并关上好了,在这外面,零碎环境配置、全书概要、面向受众、目录框架一应俱全。文末还有每个章节链接,从中能间接进入。
到这,就能够通过平台联合课程内容与实操来学习深度学习了——
那么实操成果如何?
-
哪儿哪儿的代码,都能运行给你看
以经典中的经典的 AlexNet 局部为例,感受一下。
平台上,AlexNet 因循倒退、根底原理解释均出现进去,模型的定义构建代码均可运行。
为保障初学者更好了解,还能构建单通道数据示例,察看 AlexNet 外部 8 个层的输入状况,目标嘛,在于帮咱们直观理解不同层的作用:
最要害的是,训练模型环节也凋谢实操,选中代码局部运行即可。
不过该过程容许工夫较长,咱们在 GPU 选项下训练大概应用 7 分钟,缓缓等吧!
眼看曲线缓缓缓缓画进去
值得一提的是,因为整个界面都能作为 Notebook 增加代码,记录学习思考——
因而,即使咱们课程实现,还能在文末增加代码栏,对照着章节开端习题,编程实现作业。
-
从数理根底到实操环境配置,都安顿得明明白白
下面展现还只是一个大节。其实,从全连贯层、卷积、池化等概念介绍,到 ResNet、DenseNet 解说…在 Amazon SageMaker Studio Lab 收费环境中均有出现及实操,都安顿得明明白白。
平台还贴心地思考到咱们的高数线性代数根底不一,不是每个人都过了 90 分,还把单变量微积分、最大似然等数理根底介绍和代码实现都给进去了,还附上环境配置办法,一副很靠谱的架势。
通过下面验证,这个 Amazon SageMaker Studio Lab 的确可收费又残缺地实操大神的「入手学深度学习」——
对心愿入门乃至深度把握 AI/ML 这门技术的人来说,这种实践 + 实践型的研习形式天然更为高效,日后切换到理论工作或科研甚至守业中,过渡也更为无缝。
事实上,它的能力还不仅这个程度。
一个面向开发者的收费平台
从名字上你也发现了,推出 Amazon SageMaker Studio Lab 的幕后企业是亚马逊云科技。
这家前沿技术大厂此次推出收费平台,不只将「入手学深度学习」做成实践 + 实操练习场,更想面向数据科学家、企业开发者、高校师生——
提供一个收费低门槛入门机器学习的普惠机会。
其实在亚马逊云科技之前,业内已有多个凋谢机器学习平台——
那么,这回的 Amazon SageMaker Studio Lab,又有什么值得关注的新亮点?
咱们一起先从配置看起。
平台提供 15G 以上永恒存储,16G 内存,4 个 CPU,GPU 为英伟达 Tesla T4,比目前其余支流平台稍高。
因为应用了较新架构的英伟达 Tesla T4,其混合精度运算速度指标相应也更高,此外,免费版与 SageMaker Studio 应用雷同架构,相当于叠加一层企业级 Buff,稳定性更有保障。
值得咱们留神的是,平台宣传的是 4 小时 GPU+12 小时 CPU,但实际上,咱们到工夫后仍可再次开启 Runtime,原来的文件仍然存在。
不过如果你想挖币,还是算了…
平台明令禁止应用 SageMaker Studio Lab 进行生产行为,开掘加密货币查到间接封号。
说完配置,再看下实操。
从操作性上来说,Amazon SageMaker Studio Lab 相比其余平台更简洁直观。
界面不仅仅能建设 Jupyter Notebook 文件,还反对咱们间接新建 Terminal 标签页、Markdown 格式文件。
此外,这个平台配置有 Conda 和 Pip 资源包管理器,防止咱们反复装置开源软件包,省事省心。
拉取 GitHub 我的项目甚至无需应用命令行,点击左侧按钮即可。
若克隆我的项目中有 yml 环境配置文件,在建设我的项目同时,也会同步建设好 Conda 环境。
平台还与 Github 关联。
在咱们本人的 Github 我的项目 README 文档中退出以下内容:
[![Open In Studio Lab](https://studiolab.sagemaker.a…)](https://studiolab.sagemaker.a…)
即可退出「Open in Studio Lab」按钮——
别人只需一键,即可接入 Amazon SageMaker Studio Lab 平台。
当然,咱们也能够通过手动上传或拷贝的形式新建 ipynb。
以经典的图像分类算法举例。
从其余平台拷贝一份 ipynb 文件后,无需批改即可应用,最多也就是手动装置依赖项。
实测训练与其余平台基本相同,有时,甚至稍快。
最初,得看看很多人关怀的数据安全问题。
咱们做机器学习,常常拿着大量人脸隐衷信息,甚至是尚未脱敏的医院病患信息,为爱护别人隐衷和数据安全,还得看看这方面状况。
Amazon SageMaker Studio Lab 脱胎于企业级利用,承诺每个人数据均通过加密爱护,且如果删除账户,所有相干数据也均相应删除,平台方承诺,不做保留。
目前,已有很多名校名企用上了 Amazon SageMaker Studio Lab,并为其站台背书。
这外面,有 ENIAC 诞生地的宾夕法尼亚大学工程学院,也有美国加州圣克拉拉大学金融系,还有 Hugging Face。
国内关注者也不少。
北方某 985 理工院校机器学习畛域博士生示意,他们课题组方向尽管是传统机器学习,但仍需深度学习形式辅助验证。
因为实验室的计算设施好几年前购入的,随着人员与钻研方向的减少,特地是在投稿前夕,计算资源的争抢状况很广泛。Amazon SageMaker Studio Lab 对他们来说,确实有吸引力。
说完该收费平台的种种长处,下个问题就是:怎么申请?
这里开展讲讲。
无需亚马逊云科技账号,登陆官网链接 studiolab.sagemaker.aws/requestAccount 填写邮箱及相干信息即可。
不过,为保障大家早日通过申请用起来,有些 Tips,心愿大家注意:
倡议语言用英文,填写分明相干机构名称,所留邮箱后缀与所在机构英文名匹配,这样的申请更可信靠谱。
满足上述条件,亲测 24 小时内就能取得邀请,留神查收邮箱。
无缝迁徙的进阶版
后面曾经提到了,Amazon SageMaker Studio Lab 与专业版 Amazon SageMaker Studio 为同一架构,所以,如果想从初学免费版迁徙专业版,必定不是大事儿。
对业余开发者来说,这当然提供更多进阶科研及守业的可能。
更具体看,专业版 Amazon SageMaker Studio 从头到尾曾经提供给开发者一套相当全面的性能:
比方提供大规模分布式训练,面向咱们生产性的大模型训练需要。应用分区算法,在 GPU 实例中主动拆分大模型和数据集,晋升并行度放慢训练速度。
比方数据标注性能 Ground Truth Plus,拉上了人类专家,联合机器学习辅助预标记,大幅升高标注谬误,晋升标注速率。
再比方 Amazon SageMaker Data Wrangler,该性能面向机器学习中的数据筹备阶段,可通过可视化界面进行数据抉择、清理、探查。只需一键导入,无需代码即可疾速标准化、转换大批量、构造形形色色的数据。「四大」之一的德勤就采纳了该项性能,本来几个月能力实现的数据筹备,当初压缩到几天实现。
此外,Amazon SageMaker Studio 还包含拜访权限管制治理、模型监控、无服务器推理性能、推理配置举荐…直至全周期的工业化 AI/ML 服务,都给包圆了。
上述种种,不少是往年亚马逊云科技 re:Invent 2021 新推出的性能,很大水平展现出这家企业对需要的了解和技术的前瞻性——
对业余开发者、数据科学家,不论是钻研,还是守业,这些性能均提供了更多可能性。
更有意思的是,亚马逊云科技着眼点仿佛并不止于经营业务,还有很多「不挣钱」的普惠性流动提供给咱们。
机器学习马拉松我的项目就是一个体现。
该流动一年好几场,平台一方会在 AI 相干畛域利用中拿出试题,涵盖 AI 自动化编程、对灾祸进行预防或定损等等方面。
流动将会测试挑战者 CV、NLP 等方面技能高下,这期间,相干平台、资源也由平台方提供。优胜者会失去最高 5 万美元的奖品。
像这种面向理论需要,又将技术普惠开发者的流动还有很多,而且,各有好玩之处或社会价值。
有 0 门槛即可入门机器学习的主动驾驶竞速赛 Amazon DeepRacer,关注者数百万,参加开发者已有 14 万;
也有流动跟非盈利性组织 Girls in Tech 单干,帮忙更多女性理解并上手机器学习,打消科技圈的性别差距;
还有最新推出,在圈内引发高度关注的 Amazon SageMaker Canvans,面向 0 代码教训的企业外部分析师、运营者,帮他们在理论业务中利用到机器学习这门技术。
技术大厂退居幕后
最初,如何评估亚马逊云科技的 SageMaker Studio Lab?
经营角度看,这些做法对将来自家生态构建当然无利,是头部企业放弃身位的必要动作。此外,少量企业动辄年薪 50 万招相干从业者,对很多开发者也是坏事。
毕竟,人工智能短缺肉眼可见,大部分开发者有丰盛编程教训和数理根底,惟一挡板就是:不相熟机器学习。补上这块就喝汤,心甘情愿?
不过,从行业维度看,上述动作也的确在推动前沿技术落地——
不过这里的推动,不在于更快,而在于更广。
要晓得,一百年前汽车刚创造,只有机械专家能力成为车主,以至于过后社会,司机都是一个手握前沿技术的职业。
也要晓得,三十年前,PC 和互联网只是少部分开发者的玩具,以至于开发网站都能让人迅速暴富,积攒起万丈高楼一样高的资产。
所以,百年前的人无奈了解一个人人可开车的社会,所以,30 年前的人们也很难设想本人能够动动手指领有属于本人的互联网平台。
明天放在机器学习上也一样。即使是最前沿的科技界巨匠,也只能窥见 AI 落地幅员的小局部状貌。只有一再降维,这项技术能力走进千行百业场景,在不同背景不同经验的人手里才会产生不同频率的回响——
这既是亚马逊云科技普惠布局的价值体现,也是李沐老师等大拿的公心所在。
那么,未来 AI 技术还能开释多大能量?
答案还得从每位个体开发者、每个场景裂隙里,去寻找。
更多技术风向,长按下方图片,即可理解:
人不知; 鬼不觉,又到年末,对技术圈而言,这一年中,各种技术与行业倒退,既站顶峰,也历跌宕。
在 2021 年最初时刻,亚马逊云科技想凝听来自云计算畛域开发者的声音,为此,云计算开发者有奖调研正式开启,诚邀各位搭档参加,多重好礼等你来领!