在野生动物行为钻研的过程中,辨别同一物种的个体至关重要。然而仅仅依附体型、色彩、毛发等表征,人们很难辨认它们。
个体辨认是答复生物学中许多问题的关键步骤,钻研人员通常会用做标签的办法来标识动物个体。这样的办法曾经很成熟,然而数据的收集和剖析很耗时,收集数据的环境也通常也会受到限制。
传统的做标签的办法耗时耗力
几十年来,科学家们始终在致力寻找可能无效辨认野生动物个体的办法。近期,来自法国、德国、葡萄牙和南非的科学家组成的科研团队创造了首个可能辨认鸟类个体的 AI 工具。
这项钻研论文题为“Deep Learning‐based Methods for Individual Recognition in Small Birds”(https://doi.org/10.1111/2041-…),日前发表在《生态学和进化办法》(Methods in Ecology and Evolution)杂志上。
利用积卷神经网络(CNN)这一深度学习技术,科学家们建设了可能反复辨认同一鸟类个体的训练模型。
生态学钻研中,CNN 已被利用于在物种层面的动物辨认以及例如猪、大象等灵长类动物个体的辨认。不过,在此项钻研之前,科学家们还未在鸟类等体型较小动物的个体辨认中利用过该技术。
该我的项目源于本文第一作者安德烈·费雷拉(André Ferreira)博士此前对于群居织布鸟个体对群落影响的一项钻研。依照惯例做法,钻研人员须要将黑白标签缠绕在小鸟的腿上,并在鸟巢的左近进行察看。
为了节省时间,费雷拉尝试对群落进行录像,但在画面中无奈分别黑白标签。于是,钻研团队开始摸索利用 AI 辨认鸟类个体。
钻研人员收集了大量群居织布鸟、大山雀和斑胸草雀三类小型鸟类的图片作为 AI 训练数据。其中,群居织布鸟和大山雀的图片组成辨认野外群落的训练数据,斑胸草雀的图片形成了辨认圈养群落的训练数据。
野外群落和圈养群落主动收集的训练数据示例
起源:Methods in Ecology and Evolution
在圈养的环境中,钻研人员在拍摄时能够将钻研对象临时与其余种群离开,以便收集数据。但这种办法在家养群落图像采集中遇到了瓶颈。
费雷拉博士示意,应用 CNN 进行个体辨认最大的挑战就是收集用于 AI 训练的数据。“咱们须要数千张同一个体的照片。不同于收集人类个体的照片,收集动物个体的照片是十分艰难的。”
为了克服上述挑战,钻研人员利用装置在喂食站的摄像头取得每只鸟的初始特写照片,当那只鸟返回喂食站并再次被拍到时,零碎可能将该照片与第一张照片进行比对,确定两张照片是同一只鸟。
大多数鸟类曾经装备了被动式集成应答器(PIT)标签,当该标签被喂食站的天线读取时,零碎就会记录下标签的个体代码、触发相机拍摄照片。
用于收集数据和训练卷积神经网络进行的个体辨认的程序步骤概述
起源:Methods in Ecology and Evolution
每种鸟类应用 1000 张图像,其中的 900 张用作训练数据集,剩下的 100 张用于验证数据集,钻研人员通过过采样的办法来解决样本间数据不均衡的问题。
将收集的图像录入计算机,使用 CNN 剖析照片辨认鸟类,搭载这一深度神经网络的计算机可能依据鸟类的羽毛图案辨认出鸟类个体。
该零碎已被证实在辨认群居织布鸟和大山雀方面的准确率为均超过 90%,对斑胸草雀辨认的准确率为 87%。
依据训练数据集或新鸟类预测鸟类身份时,softmax 概率的熵散布
起源:Methods in Ecology and Evolution
目前,该零碎仍有肯定的局限性。
例如,模型只能辨认数据库中呈现过的个体,对于钻研过程中新飞入的鸟类,计算机无法辨认它们。
如果鸟类的外观发生变化(例如处在换羽过程中),零碎也可能会辨认失败。此外,距离数月拍摄的同一只鸟的图像可能被谬误地辨认为不同个体。
针对上述问题,弗拉雷传授认为,如果给定的数据量足够大,就能够解决这些问题。丰盛的数据可能晋升测验假如的能力,优化 CNN 的性能。为了扩充数据量,弗拉雷传授的团队正在尝试装置更多的摄像头,以便从多个角度拍摄照片。
费雷拉博士在承受采访时说:“这些问题能够通过人工智能模型来解决。钻研人员对齐全没有标记和无人操作的动物进行主动、无创辨认的办法是这一钻研畛域的重大突破。最终,咱们有足够的空间为该零碎寻找新的应用程序,并答复过来仿佛无奈解决的问题。”
参考:
1.https://besjournals.onlinelib…
2.https://www.sciencedaily.com/…
3.https://xw.qq.com/cmsid/20200…
4.https://www.cnbeta.com/articl…
对于数据堂
数据堂(北京)科技股份有限公司成立于 2011 年 9 月(股票代码:831428),是业余的人工智能数据服务提供商,致力于为寰球人工智能企业提供数据获取及数据产品服务。
依靠本身的数据资源、技术劣势及丰盛的数据处理教训,数据堂为国内外 1000 多家人工智能企业和科研机构提供了优质的数据服务。数据堂于 2014 年实现新三板挂牌,成为中国人工智能数据服务行业第一家上市企业。
数据堂官网:www.datatang.com
数据征询热线:13051623904