iNaturalist:借助普通人拍摄的照片准确识别物种
有朝一日,我们将拥有一款应用,只要你指向奇特的虫子或是陌生的蕨类植物,该应用就能告诉你它们属于什么物种。但是,计算机视觉系统现在并不能胜任这项工作。为了帮助解决这些问题,研究人员已经汇集了成千上万张普通人在真实环境下拍摄的生物照片——通过研究这些照片,我们的人工智能助手就能深入了解生物多样性。
许多计算机视觉算法基于某个拥有大量图像的数据库进行了培训,这些图像可能包含从人到家用物品再到水果和蔬菜等各种各样的东西。这是粗略了解许多东西的绝佳办法,但如果你想深入研究特定主题或图像类型,此时又该怎么办呢?你就需要大量有关此类图像的数据。
对于某些物种来说,我们已经有了这样的技术:例如,FaceNet便是学习如何识别或复制面部的标准设置。但是,尽管电脑在识别面部时可能会存在问题,但我们很少这么做,而另一方面,我永远不会记住某个春天落在喂食器上的鸟的名字。
幸运的是,我并不是唯一遭遇这种困惑的人,多年来,iNaturalist应用社区一直在收集常见和罕见动物的图片进行身份识别。事实证明,这些图像其实就是教会系统如何识别野生动植物的完美方法。
你或许认为,我们可以从电脑上获取生物学教科书、野外指南和《国家地理》杂志上记载的一切知识。但是,当我们拍摄海狮的照片时,它看起来与专业摄影截然不同:背景不同,角度也不完美,对焦可能还关闭了,照片中甚至可能还会出现其他动物。即便是精确的计算机视觉算法,可能在两者之间也看不到太多共同之处。
你能分辨出他们之间的不同之处吗?
虽然通过iNaturalist应用拍摄的照片都属于业余类型,但它们都得到专业人士的验证和识别,而这些专业人员的表现要远远超过任何一台计算机,因此,即使在被遮挡、光线不好或周围模糊的情况下,该应用也能准确识别物种。
iNaturalist应用的数据库中存有超过160万张照片,加州理工学院、谷歌、康奈尔大学和iNaturalist的研究人员从中挑选出一定数量的精选照片。研究人员认为,若想让这些照片保持稳健的表现,就应该有很多不同的角度和情况,所以他们搜索了一些动植物种类,这些种类至少是由20个不同的人发现的。研究人员本周在犹他州盐湖城举行的 计算机视觉和模式识别(CVPR) 大会上介绍了这款应用。
即便是精选图片集(PDF),它们的数量仍然超过85.9万张,涉及5000多个类别。在这些图像上,研究人员让人们在图像中的小动物周围绘制小框进行标注,这样计算机就能知道要注意哪些东西。一组图像专门用于训练系统,另一组则用于测试系统。
图像的边界框示例
颇具讽刺意味的是,这些系统在物体识别方面表现得相当突出,因为现有图像识别引擎在这方面的表现非常差劲,初次推测的准确率甚至没有达到70%。这种使图像本身看起来非常业余且难以分析的特性,反而让它们作为原始数据显得颇具价值;这些图像没有经过处理或设置,让算法更容易进行筛选。
即使是研究人员用iNat2017创建的系统,表现也没有这么好。但这并不是太大问题——找到可以改进的空间,是确定问题的一部分。
与其他数据子集一样,iNat2017应用精选图像数据库正在扩大。研究人员指出,自从他们开始编写这个数据集以来,经由20个独立观测角度汇集的物种数量增加了一多倍。这意味着,已在开发中的iNat2018的数据容量会更大,可能会造就更强大的识别系统。
该研究小组表示,他们正努力给该数据集增加更多属性,使得一套系统不仅能提供物种报告,还能识别性别、生命阶段、栖息地和其他元数据。如果它未能确定某个物种是什么,那么它将来至少可以猜测它的属性,或是它较有把握确定的任何分类级别——例如,它可能无法确定某个物种是襟疣海葵还是 黄海葵 ,但它可以认定这种物种是海葵。
这只是改善计算机视觉在自然环境状态下的众多努力之一;点击这里,你可以了解更多与iNat数据集有关的数据收集工作和竞争;点击这里,你可以了解到与某个物种类别更相关的其他挑战。
最新声明
TechCrunch中文版已经主动撤出中国大部分内容聚合平台,但依然存在如“虎嗅”的“TechCrunch?”这样非我站人员建立的平台帐号。我方再次明确表示:除“动点科技”外,其他网站服务中“编译自TechCrunch”的内容均为未授权翻译。版式呈现和内容都有一定可能出现滞后、偏差、改动或删减。TechCrunch不对未授权平台之“TechCrunch中文版”、“TechCrunch”、“TechCrunch?”帐号,或以“编译自TechCrunch”为由发布的内容负任何编辑责任,如有纠纷请直接联系相应内容平台。
one more thing
在Telegram与TechCrunch中文版互动!
频道收听地址:http://t.me/techcrunchcn
互动群组地址:http://t.me/techcrunchcngroup
点击“ 直接加入Telegram 互动群组
亦可获取TechCrunch杭州大会最新信息
- 格力董明珠:富人应该多纳税,普通人5000元不够生活
- 普通人也想赚一个亿?欧神为你破译财富密码
- 澳洲专家分享:八种方法可以“逆衰老”,普通人都有条件做到
- 肌肉男认真“骚”起来基本就无敌了!普通人根本想象不到啊!
- 揭开西方教育骗局,终于明白精英和普通人的残酷差别!
- 普通人如何赚取人生的第一个100万?
- 思·辨 | 我们都是普通人?你可能比自己想象中聪明
- 从月薪3000到月入3W+,普通人也可以快速实现!
- 喝下百草枯后的“杀鱼弟”:我不想做网红 宁愿做个普通人
- 借助嗅探器等盗刷银行卡 一新型侵财类犯罪团伙被警方抓获