的卢深视户磊:大库时代,落地千万级刷脸系统的技术剖析与建库经验 | AI 安防峰会( 二 )

公安和安防领域一般采用多引擎的方式 , 比如一家厂商算法不够准 , 就采用多厂商、多算法同时进行 , 通过多重比对提高识别准确率 。
这样带来一些问题 , 一是系统重复建设 , 资源损耗比较大 , 整体系统造价很高;二是不同厂商之间系统缺乏统一标准 , 兼容性也比较差 , 整个系统很复杂 , 维护很困难;三是可能这种方式还不能完全满足需求 , 还是要通过人工逐级排查实现进一步的精准识别 , 推动身份的确认 。

  • 多层级
很多地方会采用区级、市级、省级逐级排查的方式 , 这样会让不同层级信息无法打通 , 存在信息孤岛 , 也使得查询效率低 , 不具备易用性 。
  • 分库管理
通过特定标准或标签对库进行拆分 , 把大库变成小库 , 然后进行分库管理和识别 , 从而提高识别准确率 。 这也会带来一些问题 , 比如统筹管理难度大 , 而且对于具备多重身份的人 , 数据会变得冗余 , 严重影响用户体验 。
总的来说 , 现有方案会导致系统复杂、软硬件开销大、成本高、效率低 。
我们回归到问题本身 , 理想的大库识别方案应该具备哪些特点?
首先 , 需要是千万级别底库;准确率要达到千万、万亿分之一的误识别率;鲁棒性要好 , 快速且安全 , 有足够的反攻击能力;性能要开放 , 能够支持多模态数据接入 , 兼容性要好;要经济实用 , 方案切实可行且能利旧 。
二、标杆案例研读与标准建库方案
的卢深视成立于2015年 , 是最早一批做三维视觉的AI企业 , 专注三维视觉智能感知技术 , 在高精度深度感知成像、三维实时高精度重建、三维跟踪识别及感知等技术方向上 , 处于国际领先水平 。
当时我们就在想 , 人脸的三维信息经过了精准重建之后能用来干什么?这些图像信息里有丰富的人脸特征 , 加上形状信息之后 , 特征会更丰富 , 也能支撑更大库的识别 。
所以我们当时就聚焦3D人脸识别这个方向 , 也非常荣幸 , 我们承接了一些国家级项目 , 在某个标杆省份实现了一个省级3D人脸应用 , 并且在这个基础之上真正实现了千万级大库的精准识别 。
这里介绍的是我们在2015到2016年的一个案例 。 这是基于的卢深视“哨兵”三维人像多维数据管控通道实现的 , 通过设备的部署 , 协助用户实现了全国首个省级规模三维人像应用 , 后期 , 我们把它切换成不需要带证件识别的直接刷脸识别安检方式 。
这个设备本身具备“一次通行、多维采集、关联碰撞、全面预警”的特性 , 在实现二维、三维人脸识别的同时还能提供四轨合一的分析 , 通过集中式管理平台 , 还可以实现行动轨迹与综合研判分析 。
这个案例当时为什么能够做成?大家一般会想 , 做3D人脸识别首先要建库 , 但是用户会觉得麻烦 , 成本就会特别高 。 如何在用户能接受情况下帮助用户把库建设起来 , 并且实施好整个系统?
的卢深视户磊:大库时代,落地千万级刷脸系统的技术剖析与建库经验 | AI 安防峰会文章插图
上图是我们当时的一个建设思路 , 的卢当时采用了“边建边用、边用边建”的创新模式 。
从2D人脸到3D人脸都是在拍人脸 , 只不过前端的传感器不同 , 相机从2D相机换成了3D相机 , 其实3D相机本身包含2D信息 , 这在2015年、2016年是比较前瞻性的应用 , 现在随处可见 , 高铁站的人脸识别设备、酒店前台的人脸识别终端都在应用 。
我们当时主要通过四个步骤:
  1. 通行人员通过三维终端如配合式设备、通道式设备、抓拍式设备或原有二维终端设备时 , 终端设备采集通行人员的人脸信息后实时向三维人像库查询 。
  2. 三维人像库返回比中的人员身份信息 。
  3. 三维人像库中暂未录入通行人员的数据 , 终端设备向客户已有的二维人像库查询 , 比对通行 。
  4. 未在库人员数据自动录入到三维人像库中 , 通行人员下次通行时即可完成三维比对通行 。
它主要是通过对身份证信息中的照片和现场拍的图像做人脸识别比对 , 准确率可以保证 , 在这样的前提下 , 我们把2D摄像头换成3D摄像头 , 就可以同时采集到3D信息 。 虽然采集的3D信息质量不一定很高 , 但是只要有足够的应用频次 , 就可以帮助用户实现一个高质量的3D数据库建设 , 而不需要特地去建一个3D人脸数据库 。 这是我们的建设流程 。
只要思路转换后 , 就会发现帮助用户建库的方式非常多元 , 可以有很多入口 。 人脸取号机、人证核验设备、手持式的移动终端等 , 所有需要做认证核验的终端都可以变成入库设备 , 当这些终端应用到生活的方方面面时 , 采集的效率和频次就会足够高 , 建设速度就将加快且成本低 。