我在达摩院,破了第一个案件

22次阅读

共计 5471 个字符,预计需要花费 14 分钟才能阅读完成。

1
在发达国家,“警民比”达到万分之四十,即使放眼在国际社会,平均也在万分之三十。
在中国,“警民比”标准只有万分之十二,在部分地区,每万人中甚至只有四、五名民警。由于警力严重不足,基层民警始终处于超负荷工作状态。
位于桐乡市的濮院派出所,即是如此。
秦朝始建的京杭大运河穿境而过,濮院曾以“日出万匹绸”成为“嘉禾一巨镇”,总面积 64 平方公里,人口约 20w,然而辖区派出所民警只有数十位。在这里,民警们站在打击犯罪、维护稳定的最前端,接警出警、打击罪犯、治安巡逻防范、调解纠纷……基层一线民警,几乎 24 小时都围绕着老百姓转。

而在最近,濮院派出所的民警们大为兴奋,许多因线索不足而迟迟未破的陈年旧案,迎刃而解,破案率大幅上升。有心犯案的人,闻风丧胆,也被此威慑收手,整个辖区的案情数量有了明显下降。
这个成绩让同行们纷纷侧目,组团过来取经。然而,令他们惊讶的是,在这份优秀成绩单后面,靠的不是持续通宵熬夜,也不是大量增加援手,而是悄悄请来了一位“华生”。
原来,来自达摩院机器智能实验室的算法专家默照,与团队共同研发了“渐进式视频搜索引擎”,帮助公安民警开启千里眼模式,将视频监测范围扩大到全城,只要犯罪嫌疑人没逃出城区,30 分钟内就能被定位。

在过去,案发后查看视频记录,大概需要人肉不眠不休地看 2 天才能锁定嫌疑人,现在通过搜索引擎 20 分钟就能找到。这个搜索引擎,如今成为民警身边得力的助手“华生”。
但是除了默照外,没人知道,“华生”刚来到派出所时,并不受待见,还是靠了一根烟才找到活干。
2
2008 年,默照被中国科技大学的电子工程与信息科学系录取。
“当时最想报的是建筑系,后来听说要买画具材料啥的,费钱,怕家里负担大就没报。”默照来自于四川乐山市一个偏远山区,说话时总会微微带着笑。
带着与生俱来的质朴与乐观,默照在汇集了严济慈、华罗庚、钱学森等一批著名科学家的中科大,从本科一直读到博士,以第一作者发表高水平学术论文 4 篇,国家发明专利申请受理 3 项,在大规模视频识别与计算加速方面,造诣不浅。
从现实世界的“建筑师”,阴差阳错成为数据王国里的“建模师”,默照用近十年练就一身的“技术功夫”,也找到了自信。接下来,就是找一个可以大展拳脚的平台,“最好越大越好”。
在默照眼里,这个平台非阿里巴巴达摩院莫属。
面试时,与华先胜老师的对话,更让他坚定了这个想法。这位达摩院“核心大脑”之一、视觉识别和搜索领域世界级科学家,为他展现了更大的可能性:“在这里,你要攻克的不是一个模型、算法、数据集,而是整个城市成千上万的云上视频,甚至更大,供你去发挥。”
默照当下拍胸脯,“只要有足够多的数据、算力,剩下的交给我就好了。”
当时他还不知道,横亘在自己面前的,远不止是技术挑战那么简单。

3
入职不久,默照加入了城市大脑团队。它的使命之一,是连通城市信息孤岛,挖掘城市数据价值。
过去 20 年,中国持续投入城市信息化建设,特别是公安交警部门,始终走在前列,为城市积累了丰富的数据资源。但是没有机器智能的帮助,一个城市一天产生的视频,光靠人力可能 100 年都看不完。这些宝贵的数据,绝大多数没有发挥作用,就已经被默默删除了。而当人们需要的时候,又不得不重新回到数据的汪洋大海里,人肉搜索。
为了解决这个困扰警界多年的“顽疾”,2018 年 4 月,桐乡市濮院镇派出所上线试点“渐进式视频搜索引擎”,将视频监测范围扩大到全城,力图迅速定位犯罪嫌疑人。
这个引擎属于浙江公安大脑•乌镇的一部分,视觉部分由默照负责,具有举足轻重的意义。一旦成功,中国民警们将有机会第一次掌握真正的“千里眼”,犯罪分子无所遁形。
不料,默照刚到濮院派出所的第一天,却吃了个闭门羹。
在濮院派出所,民警几乎没有闲下来的一刻:记笔录,接电话,看视频,没人理会这位带着书生味的博士。
“每当分析案情时,他们都是扎推讨论。我试着凑过去,都没人搭理。”默照的回忆带着些许自嘲。
读研时,写下人生第一行代码;博士第四年,才发表第一篇顶会 paper。看似稍显瘦弱的默照,有着一颗异于常人的强大内心,习惯了在逆境中越挫越勇。
接下来,默照继续厚脸皮,像只跟屁虫一样围着办案民警转,有机会就讨教学习,趁机推销。他深信,这套世界一流的技术解决方案,能够为破案贡献一份力,然而眼前连停下来听他讲话的对象都没有。
持续不懈地转了几天后,一位年轻的民警看不下去了,把默照拉到一旁,悄悄给他出了个主意。
当晚,这位几乎没碰过烟的博士,跑到镇上便利店买了包烟。第二天抓住休息时间散发,与民警们掏心窝闲聊,一来二去,聊开了。这时,默照终于了解到为何民警们态度如此冷淡。
原来,濮院派出所之前布置过“类似这样的所谓‘高科技’产品”,但都效果平平。在扎根基层一线数十年的办案民警看来,这样的系统不过是个“花瓶”,中看不中用,真正管用的是摸打滚爬、含泪沐血换来的实战经验。更何况,这种新系统都要重学一遍,对于工作压力繁重的他们来说,更是兴趣缺缺。
了解情况后,默照当即打了包票:“我来做,你只用看几眼就行!”随后,他借机详细介绍了这套系统背后的技术原理,这些话他在心里不知反复练习了多少次,终于等到这一天。
民警们开始动心起来,最后终于有人表示,“我不知道靠不靠谱,但是如果你们不行,估计其他人也不行!”
就这样,一根烟,像一把小火,把彼此生疏的严冰给化出了条缝。
但想要取得完全的信任,只有用结果说话。

4
在实验室里,如果假设验证不行,可以换个模型,从头再来;但这一回,默照清楚自己只有一次机会。一旦搞砸,不仅整个团队数年心血可能流产,更重要的是,某种意义上,民警们已将“达摩院”视为业界技术的代表,如果这一战失败,他们对技术的信任将再难挽回。
有一种选择,叫只能成功不能失败。
默照义无反顾扎了进去。
濮院派出所每月接到的案件里,20% 左右的普通案件因线索少破案难,很可能会长久躺在卷宗中。默照接到的就是这样一件典型的财物盗窃案,因为线索少,找不到突破口:
2018 年 4 月初,濮院村民建国放在村里某楼大厅的钱包被盗,损失总价值一千余元。
接到报案后,民警们立刻分析小区视频,锁定犯罪嫌疑人,截取出一张较为清晰的半身正面照和一张普通摄像头下的骑车照。
然而棘手的是,这名犯罪嫌疑人具有明显的反侦察意识和手段,活动范围不规律,刻意隐藏行动路线。在接下来的几天里,民警们没有搜查到更多线索,案件陷入停滞状态。
对默照来说,这次技术挑战将会是空前的特殊。
近年来,随着大数据的发展、算力的空前提升,机器智能成为大热方向,运用在 IoT、教育、医疗、物流等各个领域。机器智能的“核心中枢”——算法,诞生在信息搜索场景里,第一优先考虑的是“精度”(precision)。
比如,某位消费者想买件“A 字格子裙”,她会在淘宝搜索框输入这些文字,随后系统会结合用户历史数据,在数亿商品中找到最可能受到青睐的商品,呈现在她面前。如何让消费者最快找到心仪之物,这是算法有生以来的最高使命之一。
然而,这与破案的要求恰恰截然相反。
对于民警来说,线索如同破案的生命线,贯彻始终。任何一条信息,都有可能成为破案的关键、证据链里不可或缺的一环。因此,在破案场景中,搜索算法的召回率(recall)要求逼近 100%。
“如果某片草原上有 500 只羊,我们希望每一只都能落在搜索范围里。”
在算法领域中,召回率和准确率是一对永恒的矛盾。既要广而全,又要精而准,所有人都知道,这注定无法两全。
想要破局,需要两把钥匙,缺一不可。
第一把钥匙,是默照与团队研发的“阿里云城市视觉智能引擎”。它的行人识别算法,被国际权威顶会录用,行人首位命中率指标为 97.3%,优于当时所有方法,做到了世界第一。针对实战,在骑车人识别、小目标检测、精细化属性识别、人车互搜等方面完成了从无到有的技术积累、突破。
默照当下就以濮院镇永越村为中心,圈定初步搜索摄像头范围,通过仅有的半身照,短短 20 分钟就提取出嫌疑人当天下午的活动轨迹点位图。
来时轨迹一旦确认,这无疑给案件撕开一个巨大的突破口子。民警的积极性大涨,立刻调出路口摄像头监控视频,分析出嫌疑人进入案发地点前的活动方向,从而大大缩小了搜索范围。
接下来,破局的另一把钥匙,掌握在民警的手里。

5
之前虽被冷落,但是经过多日的朝夕相处,默照对他们的认识更近了一层。民警们无一不熟悉濮院地形、风土民情,能够合理预判、决策果断。更令人惊奇的是,他们拥有像鹰一样锐利的眼神,直指目标对象。即使照片再模糊,往往看一眼即可辨认出嫌疑人,十有八九不会看走眼。
“有时候,视频里的人影只有模糊一个小点,一般人根本看不出,我们的搜索引擎也是。但是民警瞄一眼,就能立刻指出来,‘就是他!’”默照感慨,技术初看起来很神奇,能完成人类做不到的事,但是人类总有一部分能力,是技术永远无法替代的。
这是人类千万年进化来、不曾被破译的秘密。
就这样,利用最初两张照片的线索,默照将全辖区范围内的相似目标逐一筛出来,经由民警肉眼识别后,再将新确认的照片放入目标素材库里进行搜索,通过反馈确认、多次搜索,渐进式地提升搜索的精度。如此一来,通过民警与搜索引擎的多次交互,既能迅速获得全部线索,又能保证准确率。
这就是“渐进式视频搜索引擎”名字背后的含义。“华生”再给力,破案依然少不了福尔摩斯。两者合力,方能攻无不克。
很快,民警发现嫌疑人进入某封闭式小区,超过一个小时都没再出来。
距破案只剩一步之遥!
为了最终确定,默照和民警利用跨天搜索技术分析近期视频,查到该嫌疑人数次将自行车停放在门口,步行进入小区。
“这个小区只有一个出口,只要有两小时以上没出来,大概率跑不了。”民警心里已经十拿九稳。
与此同时,民警进一步查询案件数据库,发现该嫌疑人为入室盗窃的惯犯,此前已经有多次犯罪记录,半年前刚刚释放。
一切水落石出!
濮院派出所当即决定实施抓捕,当晚在该小区布控,蹲点等候,终于在翌日晚 7 点,成功抓获犯罪嫌疑人。
这位惯犯怎么也没料到,自己行走“江湖”多年,第一次出手这么快就被捕。从默照接手案件,到嫌疑人落网,仅仅不到 30 个小时!
当晚,听完汇报的公安局局长,非常激动。这是城市大脑解决的第一个案件,也是公安界盼了数十年的好消息。从此,公安民警有更多能力做到大案和小案一起抓,全力创建一个平安的社会治安环境,人民群众将拥有更多幸福感和安全感。
经过此次案件后,民警的态度有了彻底的转变。默照每天一早来派出所,总会有民警主动来找他:“这是嫌疑人照片,小哥帮我看下”。他们约默照吃夜宵,当初反对声音最大的民警甚至开起玩笑:“我有女儿的话,一定要嫁给你。”
搜索引擎上线后,破案件数大幅提升,警情数量下降 12.6%。很快,类似的技术也在桐乡市其他派出所、衢州、余杭投入使用,一时间技术震慑力远震四方。

6
“城市大脑”不仅能抓人,“寻人”也同样拿手。4 月中旬,衢州市红十字会应急救援队发出一条信息:一位 80 岁爷爷,在当天下午 3 点发现出走。接警 15 分钟后,民警利用“渐进式视频搜索引擎”迅速定位到地点,获得宝贵线索,而在过去,人工搜寻通常需数小时。
在打击非法捕捞牟利、保护重大财产方面也建树颇丰。衢州警方通过嫌疑人面部清晰照片,迅速搜集到长达一个月时间的连续犯罪证据,顺藤摸瓜找到关联人员,推断出销赃轨迹。最后在菜市场成功将犯罪团伙捕获,成功破获价值 100 万余元非法捕捞案。从发现到抓捕,仅仅用了 5 天。
2018 年的乌镇互联网大会期间,这套系统肩负了协助安防的重要任务。不到一个月的时间里,连续为十多个案件提供重要线索。以永乐新村电动车失窃案为例,在视频接力失效情况下,提供跨度两天多达 18 个点位,完整还原嫌疑人活动轨迹;助力民警进行目标行踪规律的分析,准确定位嫌疑人当前点位,实现高效抓捕。
同时,这些扎根在现实场景、经过大规模实战检验过的成果,也形成了多篇精彩的论文,几乎在国际学术顶会里拿了“大满贯”——AAAI 2018、ACM MM 2018 等均被收录。
对现在的默照而言,发顶会 paper,做一两个点的优化,依然是值得庆祝的事。但是,当看到以往躺在纸张上的算法模型,被真正应用在社会生活中,产生看得见的价值,这更让他激动。
“每一天叫醒我的不是闹钟,而是有太多有趣的事情想去做。”提起现在在做的事,默照显得有些兴奋,眼里好像有光在闪耀。去年他刚刚成功晋升,马不停蹄地投入到安防领域标准 AI 解决方案的制定中。一旦完成,将对整个业界带来革命性的影响。
“我觉得自己特别幸运,能遇到这么好的机会,还有一帮靠谱的兄弟。”当初手把手教默照写代码的同班同学岳西,如今也成了同一个团队的战友,这让他非常开心。
越努力,越幸运,也许这是对默照的最好注脚。

7
每一次技术革命,都会推动城市文明前进一步。
蒸汽机时代,城市的标志是修公路。
电力时代,城市的发展是铺电网。
我们身处的互联网时代,数据成为重要的资源,城市需要构建一个数据大脑来再一次提升文明。
就像 160 年前伦敦第一次开通地铁,135 年前曼哈顿第一次建设电网,城市大脑将成为一个全新的城市基础设施。

随着城市大脑成为首批国家新一代人工智能开放创新平台之一,达摩院机器智能实验室,肩负起了研发和应用智能技术来改变城市管理和发展的历史使命。
在阿里,像默照这样的算法工程师,还有很多很多。大而实在的应用场景为技术创新提供了良好的土壤,他们紧贴业务场景,让算法模型与用户需求真正产生化学反应,使技术在实践中突破创新,在实践中成长演化,在实践中落地生根。
这是一个美好的时代,也必将是一个伟大的时代。

本文作者:孝杨阅读原文
本文来自云栖社区合作伙伴“阿里技术”,如需转载请联系原作者。

正文完
 0