logo
这是描述信息

用计算机视觉技术赋予ACS闸机洞察世界的双眼

 

 

李杨

苏州雷格特智能设备股份有限公司

 

摘要:出入口控制系统(ACS)也称为闸机,被广泛应用于城市轨交、高铁及高档楼宇的出入控制,用于管理人流并规范行人出入。近年来伴随着人工智能技术的迅猛发展,ACS闸机也正在迎来新一轮的技术变革。借助计算机视觉技术,下一代ACS将具备更加智能通行逻辑控制,令闸机精确的识别通道内通行的行人和行李物品,并对他们加以跟踪,实现诸如身高测量、儿童行李友好通行等核心功能。

 

  出入口控制系统亦称为闸机,广泛应用于城市轨交、高铁及高档楼宇的出入控制,用于管理人流并规范行人出入。第二代ACS的核心技术是通行逻辑控制技术,其利用十数对红外对射传感器实现了对通道内行人的追踪,并适时控制阻挡装置的开闭实现对行人的规范。第二代ACS借助通行逻辑控制技术相较第一代三辊闸机提供了更加友好的通行体验,在轨道交通领域已经成为主流。然而由于第二代ACS采用的红外对射传感器阵列密度较低(只有20对以内)只能对通道内的行人做非常粗略的检测和跟踪。这种低密度的对射传感器通常不具备区准确分行人的能力,因而时常发生拍打、夹伤乘客(尤其是儿童)的事故。同时由于传感器阵列的空间尺寸较大,使得闸机通道阵列占地面积也相应较大。此外目前主流应用的第二代ACS也缺乏精确的身高测量能力。

  近年来,伴随着人工智能技术的迅猛发展,ACS闸机也在迎来新一轮技术变革。例如生物特征识别技术、移动支付的成熟应用促成了AFC系统支付手段的变革。而在ACS的最核心技术通行逻辑控制技术方面也在酝酿一场巨大技术升级,这其中计算机视觉技术作为新一代ACS的支撑技术受到了AFC行业的关注。

 

 

1、计算机视觉——新一代通行逻辑的支撑技术

  作为人工智能的一项关键能力,计算机视觉总是和人工智能相伴出现。计算机视觉技术目前已有很多应用,比如身份核验闸机借助人脸识别技术实现了以往人工完成的票证核验工作。再如手机相册的分类功能,手机根据相机拍摄的人物、物体、场景帮你分门别类。正如我们用眼睛和大脑来感知世界,计算机视觉的目标之一,就是以类似的方式来“观察”和“处理图像。计算机甚至可以通过多种方式“看到”我们无法感知到的世界,例如通过热成像仪对行人体温的探测。作为人,我们显然很容易感知周围世界的三维结构。想一想,当我们观察身边桌上的一瓶花时,三维的感知是怎样的生动鲜明。通过光线和阴影在其表面显现出来的细微差异,我们可以分辨出每个花瓣的形状,毫不费力地从场景的背景中将每朵花分割出来。观看一幅有边框的合影时,可以轻松地数出照片中所有的人(并说出名字),甚至可以从他们的面部外观猜出其情感状态。感知心理学家已经花了几十年时间试图理解视觉系统是如何工作的,尽管他们能够想出光学错觉来梳理其原理的某些部分,但这个难题的完整解答仍然扑朔迷离。近几年,随着深度学习技术的提出和发展,我们在分析图像语义、图像分割等领域有了突破性进展。

 

 

1. 第三代基于计算机视觉的智能通行逻辑与第二代通行逻辑比较

 

  同时,计算机视觉领域的研究人员也一直在研究恢复影像中物体的三维形状和外观的数学方法。在智能通行逻辑控制的应用场景中,如何识别出闸机通道中行人的姿态和身高等三维动态特征显得尤为重要(图1)。借助三维感知技术我们就有可能更加精确的感知一个闸机通道内的情形,从而赋予下一代ACS闸机更加智能的通行逻辑控制能力。基于计算机视觉的智能通行逻辑可以令闸机精确的识别通道内通行的行人和行李物品,并对他们加以跟踪,使得闸机具备更高的通行效率和反欺诈能力。借助三维感知与识别技术我们赋予了下一代闸机一双真正感知世界的眼睛,实现传统闸机目前无法实现的诸如对孕妇、儿童人群的保护,让她们友好、安全的通行通过闸机。

  目前我们已经有可靠的方法能够从几千幅部分重叠的照片精确地计算出环境的部分三维模型。例如在有特定物体或建筑物正面足够多的一组视图,我们就可以使用立体匹配方法创建出稠密的三维表面模型。我们也可以在复杂的背景中跟踪运动的人,使用人脸、衣服、头发的检测和识别相结合的方法,我们甚至可以试图找到照片中所有的人并说出他们的名字。尽管伴随着深度学习技术的发展,我们取得这样的进展,但要让计算机拥有一个3、4岁大的孩子的图像解释能力(例如,例如分辨出照片中每个人的表情),仍然是一个极具挑战的任务。视觉为什么如此困难?部分原因为它是一个逆问题。在数学中我们称之为Inverse Problem, 在信息不足的情况下,我们试图恢复一些未知量来给出完整的解答。因此,计算机视觉就必须求助于基于物理的和基于概率的模型来消除潜在解的歧义。

 

2、行人检测问题的研究现状

  近十年来,基于计算机视觉的行人检测与跟踪已日益成为国际上模式识别、计算机视觉和人工智能领域最活跃的研究主题之一。其核心是利用模式识别研究领域的理论成果,结合计算机视觉技术从视频序列中检测出行人并跟踪。行人检测与跟踪作为一种关键技术,是计算机视觉更高层次行为理解分析的基础,它的精度和鲁棒性直接影响到后续的各种诸如目标识别、行人运动分析和行为的描述与理解等高级应用处理。因此,基于计算机视觉的行人检测与跟踪是许多高级应用的基础,例如智能视频监控、智能交通、汽车辅助驾驶、高级人机交互、基于运动姿态的行为分析、虚拟现实等。通过对行人进行检测和跟踪,就可以获得行人的位置、速度、方向、尺度、姿态等信息,通过对这些信息进行综合分析和处理,就可以令闸机精确的识别通道内通行的行人和行李物品,并对他们加以跟踪,使得闸机具备更加智能的通行逻辑控制能力。

  在过去的十年中,行人检测领域的工作大致可被归为以下两类:

  第一类是近年较为流行的基于深度学习的方法,各种深度网络不断被学者提出,如Faster RCNN,YOLOSSD等。这些目标检测网络均可用于行人检测。但是通用的目标检测网络在行人检测问题上有一定问题,如Faster R-CNN 在目标检测上非常准确,但在行人检测上效果一般, Faster R-CNN 用于行人检测效果不好的原因主要是由于背景的干扰。Faster R-CNN通过RPN 生成卷积特征图和候选框,其RPN主要是用于在多类目标检测场景中解决多类推荐问题,因此可以简化 RPN 来进行单一问题检测。 例如通过Boosted Forest 作为分类器来提取卷积特征,从RPN 提取的区域,使用RoI 池化提取固定长度的特征,从而提高行人检测的性能。

  第二类是机器学习经典方法。如以Gavrila 为代表的全局模板方法:基于轮廓的分层匹配算法,构造了将近 2500 个轮廓模板对行人进行匹配, 从而识别出行人。为了解决模板数量众多而引起的速度下降问题,采用了由粗到细的分层搜索策略以加快搜索速度。再如将传统的检测方法Boosting 和 CNN 结合起来的方法。Boosting是类机器学习的经典方法,用来提高弱分类算法准确度的方法CNN则是随着深度学习提出一个基于卷积核的经典深度网络。两者相结合提高了经典方法的性能。

  此外,解决多尺度问题也比较重要。例如在视频数据中人的尺度变化问题。一种常见的方法是训练两个网络,一个网络关注大尺度的人,另一个网络关注小尺度的人,在检测时将两个网络进行加权融合得到最终的结果,这样能使性能得到很大的提升;UCSD 在 ECCV 2016上有一个类似的工作,提出在高层提取大尺度人的特征,在低层提取小尺度人的特征,这样能保留尽量多的信息量,使得对小尺度的行人也有较好的检测效果。

2. 行人检测与追踪问题

 

3、行人追踪问题的研究现状

  所谓基于视觉系统的目标跟踪是指在图像序列中,依据先验知识和当前帧带来的新的观测信息来确定目标在当前帧的位置、速度、尺度、加速度和运动轨迹等参数,这些运动参数可以为后续的更高层次的行为理解、语义分析等提供非常重要的先验知识。目标跟踪是计算机视觉领域里面的一个研究热点,也是下一代智能通行逻辑控制的关键技术。在通行逻辑控制中,一个非常重要的子任务是多人跟踪,其中比较常见的是基于检测的跟踪,也就是将每一帧的检测结果关联成轨迹,每个行人目标都有各自的轨迹。

  目前针对不同的应用背景和跟踪场景,已有大量的研究文献和研究成果被提出来,这些跟踪算法根据算法原理可以大致划分为确定性和概率性两种跟踪框架,基于梯度的均值漂移(Mean Shift)跟踪算法和贝叶斯理论下的粒子滤波(Particle Filter)跟踪算法分别为这两种框架下的代表算法。基于视觉的行人跟踪,相对于跟踪其它目标来说,由于跟踪场景和应用的多样化,如机场、车站的视频监控,办公场所和大楼的安保,十字路口行人的监控,体育运动视频对人的跟踪以进行姿态分析和姿势识别等,另外行人自身的非刚体特性,行人间的轮廓相似性,这些都导致行人跟踪方法需要复杂多变一些,要想获得稳健的跟踪就需要更多的准则,更强的条件约束和更复杂的跟踪算法。

  均值漂移跟踪方法是一种经典的利用颜色特征,并采用均值偏移策略来寻找和目标颜色分布相似的最优区域,但该算法在寻优过程中完全丢弃了目标的结构信息,所以很容易受到包含相似颜色的背景或其它运动物体的影响,这将导致跟踪位置的漂移。粒子滤波算法通过对粒子群的重采样,扩散,似然度评价三步来不断地在状态空间中传播粒子群,并且以整个粒子集构成的概率分布来代表当前目标的状态,但基本的粒子滤波算法同时也遇到了粒子状态转移后不能很好地描述目标的后验状态分布、粒子贫乏等问题。

  在具体的应用方面,基于视觉的行人检测和跟踪受到国内外诸多公司和科研院所的高度关注,并且在理论和应用两方面都取得了可喜的进展,有些产品在人们的日常生活中已经得到了广泛的应用。如在上海世博会期间实现的基于视觉系统的行人流量分析、区域入侵检测等安保功能。在基于视觉系统的行人跟踪算法的开发过程中需要相关的视频图像序列对提出的跟踪算法进行测试,为了比较相关算法的性能,相关的科研院所建立了多个各有侧重点的公共数据库。这些数据库为评估目标跟踪算法的性能提供了客观的依据。

 

4、结论

  借助计算机视觉技术,下一代ACS将具备更加智能通行逻辑控制。计算机视觉可以令闸机精确的识别通道内通行的行人和行李物品,并对他们加以跟踪。具备基于计算机视觉技术的智能通行逻辑控制器的下一代闸机可望相比于二代ACS更高的通行效率和反欺诈能力,提高了大客流量通行效率与尾随逃票等欺诈行为的应对能力。

 

 

 

 

 

 

 

 

 

底部logo

 

我们致力于提供尽可能好的产品和搭建比较丰富的资讯平台,不断提升服务水平,改进服务方式,以“平等、尊重、互利、共荣”为理念,共促行业发展,竭诚为各界人士提供专业的服务。 

地       址:北京市海淀区后屯南路26号308

客服热线:010-82755851

客服邮箱:554788740@qq.com

版权所有©2020 AFC信息网  京ICP备09055203号-4​  京公网安备110108002671号  网站建设:新网