乐趣区

腾讯云技术专家卢萌凯手把手教你Demo一个人脸识别程序!

欢迎大家前往腾讯云 + 社区,获取更多腾讯海量技术实践干货哦~
本文来自腾讯云技术沙龙,本次沙龙主题为 Serverless 架构开发与 SCF 部署实践 卢萌凯:毕业于东南大学,曾就职于华为,熟悉云行业解决方案。目前负责腾讯云中间件产品及无服务器云函数的技术架构打造,帮助用户完成方案设计,对云端存储产品的使用难点有独到见解。

大家好。我是腾讯云中间件及无服务器云函数架构师。我今天介绍分四部分:第一,对象存储 COS 简介。第二,比较实用的一部分,SCF 与 COS 结合使用的应用场景。第三,比较有意思,人脸识别 Demo。调用 AI 的接口,用几行代码就把人脸识别的 Demo 就实现了。最后一部分是最佳实践。其实主要是来看一下在 COS 使用过程当中有哪些需要注意的地方。

我们先来介绍第一部分,就是腾讯云存储平台发展历程。首先我们可以看到在 2006 年的时候腾讯云发布了第一代分布式存储平台,叫 TFS。经过近十年发展到 2014 年存储量达到 500P,也是在这一年随着腾讯云推出,腾讯云存储系统开始对外服务。到现在腾讯云超过 EB 级存储,现在对内服务腾讯相册,QQ 以及外部的 58 同城和大众点评等。

对象存储是什么?这页简单介绍一下对象存储概念,如果用云上的话,就是用云的概念,腾讯云对象存储提供的是面向非结构化数据,支持 HTTP 和 HTTPS 协议访问的分布式存储服务,它能容纳海量数据并保证用户对带宽和容量扩充无感知,这里可以理解为基于 Serverless 架构。同时对象存储也会对云上其他的产品做一些深入的结合,比如和 CDN 结合,用户传到 CDN 音视频可以选择 CDN 进行加速,也可以跟云上音视频转码服务相结合,上传到 COS 音视频可以做转码服务。支持万象优图服务,可以对图片加水印等方面处理。
这里列了一个 COS 对象存储简易流程,用户可以通过手机 APP、网站或者 H5 页面可以方便简单的访问。COS 会和云上其他的应用结合,同时用户也可以选择和 COS 本地服务相结合。

这里给了一个 COS 应用架构,上面是一个传输服务,可以选择 CDN 加速。比如用户需要上传到 COS 延时高的情况下可以选择 CDN 加速;同时可以选择腾讯云提供的专线服务,可以保证延时。同时可以使用运营商服务。
应用接入层可以选择应用服务,像图片智能识别和处理,音视频处理等。同时 COS 可以和云上一些大数据套件对接。一个简单的场景,用户可以用云上的 Kafka 直接写入 COS,COS 和大数据对接来做用户行为的分析。
下面是数据接口,这边是 COS 底层的一些接入方法。最底层是分布式数据存储,我们可以通过 API 或者通过 HTTP REST 来访问接口。

这里给了一个简单的应用流程,最左边可以看到用 WEB 服务,或者 APP 终端,通过运营商网络接入到对象存储,做一些简单的上传和下载动作;同时,腾讯云上的 COS 可以做 CDN 分发,或者做格式转换,或者对接到云上的云主机或者私有的客户自己的云服务,做一整条流程的打通。

把刚才的应用案例再细化一下的话,这边给出了一个用户在实际使用过程当中的架构图。首先,最左边的用户可以通过调 API 接口,或者自己调云上封装好的 sdk,在自己代码里去读写 COS。或者通过控制台很方便的上传和下载一些文件。这边是腾讯云上 COS 云存储,这里一共给了三种应用:一个是标准存储,一个是低频存储,还有近线存储。低频存储是用于读写数据频率比较低的场景,比如说是网盘的运用。近线存储主要用于归档数据,它可能是一些冷数据,不经常用,可以用近线存储,它也可以提供高可靠的数据保存。同时,它的成本也是非常低的。
同时对象存储可以对接云上其他的服务,并针对不同的用户可以设置不同的访问权限。我这里放了一个视频对应用场景做一个总结和发散。

我这里写了一个简单的 Demo,主要做人脸识别,首先我会创建两个存储桶,这两个存储桶用来上传用户的信息,触发 SCF 调用,其中一个做用户特征的提取。第二个存储筒上传第二张用户的图像,和第一个比对,查看是否可以查到这个用户信息。SCF 里直接调 AI 的接口,大概有四、五行代码就能实现创建用户的信息,再加一行代码就能比对用户信息。这里用 SCF 日志展示输出。这个流程图是这样的,首先我在 COS Bucket1 里上传一张图片,看他是否是一个新用户,不是的话就创建一个特征,如果是,就把这个人像添加到已创建的用户特征。另外一个 Bucket 叫这个名字,这个也会触发相同的 SCF,用于查看用户的特征,如果查到的话这个用户可以获取权限;如果查不到就会返回到无权限。

具体的话在控制台上我这边已经写好了这个函数,我们通过查看函数执行日志来查看输出结果。这里我已经创建好一个 bucket,这个用来用户上传图像来提取用户特征。我会做一些测试,我已经有一些测试图片了。我现在在网上随意下载一个用户的图像。我们看到这个图片上传成功了,叫范 2,我现在到云函数控制台查看一下日志,这边可以看到时间是 16 点 37 分。现在是没有权限的,再上传一张图片,在 new face 提取一下特征,还是刚才那张图片。已经上传成功了。由于刚才是没有她的用户特征,所以这里会创建一个新用户。我在上传另外一张图片,这两张图片是不一样的,16 点 38 分刚刚上传成功。现在再回到控制台这边查看日志,现在看到刚才范这张照片,可以查看到她的特征了。
我再给大家看一下代码。我刚才实现的代码里,大部分都是从 cos 里下载图片的代码和逻辑判断,实际做人像识别的代码是直接调 AI 接口。这里还会对图片做大小判断,如果太大的话会做一次裁剪,因为太大的话可能上传到 cos 时会报超时。下面我还列了一些对 AI 接口的操作,这里有很多的接口都封装到了 SDK,直接调用大概也就几行就可以实现,比如人脸检索,特征信息创建,人脸比对两张照片是否是一个人,还有身份证识别,所以使用起来是很方便的。

现在回到 PPT,这一部分介绍的是 COS 和 SCF 结合的应用架构和应用场景。第一页是放的云函数架构平台,这边是 BaaS 架构。用户可以上传代码和做一些配置在云函数平台,并选择 COS 触发器,同时也可以选择上传或者删除事件来触发这个云函数。文件上传到云函数后,可以在云函数里做很多操作,比如说我可以做日志备份,跨区域的文件复制,写云数据库,做一些图片处理或者语音识别等。或者我可以用 SCF 对接 IoT 平台,把数据推到 IoT 终端。大部分的云服务都可以和云函数平台做一个结合。
这样用的好处是 COS 这边可以提供高并发的场景。云函数这边也可以支持高并发。用户只用聚焦自身代码的实现,使服务可以快速上线,且当用户的调用量很大的时候,这个架构也能很好的应对,有效的应对波峰和波谷。

把才的场景轴象化、简单化后,可以看到左边是 COS 存储桶,我可以做上传删除等等,右边可以和其他的产品或者服务做结合,像自定义日志分析,和消息队列做事件通知。

这里举例用户头像制作,用户上传图片到 COS,触发 SCF 运行,SCF 对图片进行处理后发送到客户端,并写入 COS,删除原图。假定我这边配置 SCF 内存 128MB,单词执行时间 1 秒,平均每天被触发运行 5 万次。COS 配置触发 SCF 运行,用户上传到 COS 的平均文件大小 1MB,每天上传 5 万次,被 SCF 处理后,图片大小为 100K。这样算出来 SCF 是这三部分的加和,因为这里免费额度的原因,所以这边资源使用费用是零,相当于是免费在使用 Serverless。这边调用次数的费用是 0.69 元,每天触发调用 5 万次,一个月的费用不到 1 块钱。另外一个费用是因为这边有外网出流量,每次上传是多少 GB,然后乘以 5 万次,再乘 30 天,每 GB0.8 元,算出来是 144 元。如果没有往客户端发流量,所有的流量都在平台内部打转的话,这个费用也是没有的,相当用 SCF 的费用基本上不到两块钱。
COS 的话这边也是把免费额度扣除掉之后,每次用户上传,存 100K 的图片,加上读写 IO,算出来是一个月 14.6。所以这边加起来一个月不到 130 块钱。这是一个实际应用场景里 COS 和 SCF 的价格举例。

这里我又列举了一些用户的实际案例,这边因为没有拿到用户的授权,所以没有把用户的名称放出来。这个案例是视频文件转码,这边是用户视频文件上传,调用腾讯云的视频解码服务,再根据不同码率写到 COS,COS 最后会用 CDN,对视频文件做一个加速。这里所有的触发都在云上,你不需要运维,同时这边的服务也是非常的便宜。

这个是 CDN 自动刷新,很多用户会用到 COS 和 CDN,把 COS 文件做 CDN 加速,但是这里有一个问题,每次文件更新都需要手动点击刷新,现在就不用了,上传到 COS 的文件自动触发 SCF,SCF 调 CDN 的 API 接口,实现自动刷新。

这个客户案例,是做日志文件分析,客户的点播平台每时每刻都在产生大量的日志,怎样快速低成本的对这些日志进行统计分析,筛选出最受欢迎的视频源,点播峰值时间段等并展示出来成为客户面临的难题。

这个案例是一个在线视频教育的案例,老师和学生会有视频课程,它们会从视频课程抓取图像,然后把这些图像上传到 COS,然后 COS 会触发 SCF 做一次分析,把这个写到消息队列,并通知客户自身的业务模块进行分析,从而来判断老师和学生之间是否有敏感信息产生。

这是一个自动灾备的案例,客户是荔枝微课,用户在 APP 或者电脑端做文件上传,文件上传以后,需要同步到跨区域同跨帐号下的其他 Bucket。

最后我说一下最佳实践。其实只要能为用户实际创造价值,它就是一个最佳实践。这边我列举了几条,主要是在使用 COS 和 SCF 过程中的注意事项。比如 COS 触发 SCF 的流程,首先 COS 会把上传和删除事件写到自己的消息队列,和云函数 SCF 消息队列做一个对接,云函数消息队列会触发云函数执行每次的事件操作。所以这是异步调用。有同学会问这边是不是实时的,如果正常情况下,没有消息堆积的话是毫秒级。如果某一时刻有大量用户做上传视频或者删除动作的话,可能会产生消息堆积。如果来不及消费,可能在秒级触发 SCF 运行。
COS 触发 SCF 只支持同地域配置。
COS 支持前后缀过滤触发,以及同一 Bucket 中多种事件类型触发 SCF。
为了避免 COS 的事件生产投递出现错误,COS 针对每个 Bucket 的每个事件限制只能绑定一个可触发的函数。主要为了避免用户出现循环的调用,触发错误。
目前单个云函数支持绑定 2 个 COS 触发器。
最后一个是列举了 COS Bucket 的消息格式,会把什么样的信息发给 SCF。SCF 在这个事件里把消息拉出来。比如用户的 APPID,用户上传的文件名,以及用户 Bucket 所在的地域,这边都可以拿到。所以在 SCF 这边可以拿到用户上传到 COS 大部分的文件信息。
有同学问到,传统开发模式和无服务器模式架构的区别,或者说是用传统开发模式的优势或者两者之间的成本对比。这边可以看到对于传统架构设计,比如买了云主机,架构分层,功能划分,模块通信等等都需要考虑。用无服务器只需要对函数功能进行划分,同时把一些具体的功能通过事件触发的形式去绑定到一起,这边架构上会减少很多工作量。但是,如果说这个逻辑或者服务计算是非常重的话,其实还是用传统开发模式可能会更好一点。另外如果云主机使用效率在 70% 以下的话,其实 SCF 会便宜很多,同时 SCF 可以省去很多运维和环境搭建的工作。
代码开发,传统模式要考虑到容灾,业务逻辑的对接。云函数只需要关心自己的业务代码,把业务代码写好后配置相应的触发器,这边就可以运行了。
代码调试,登陆服务器使用熟悉的工具在本地调试。无服务器目前主要依赖日志调试。
发布部署,云函数这边可能效率会更高一点,但是差别不是很大。
Q&A
Q:我在更新我的模型文件的时候,会不会对我其他的文件产生影响?
A:像对 COS 做热更新的时候,在那个时刻会有影响,但是在过程中没有影响。
Q:SCF 到底是什么?
A:简单来说 SCF 就是一种计算资源。我们有时候会叫它 FaaS。FaaS 是一个概念,SCF 是一款产品。
本文 PPT 附件请点击原文下载。

问答 Serverless:如何删除一个函数?相关阅读多个场景中的 AI 落地实践低于 0.01% 的极致 Crash 率是怎么做到的?【每日课程推荐】新加坡南洋理工大学博士,带你深度学习 NLP 技术

退出移动版