□ 文/本刊记者 罗 超
智能视频分析搭上AI 世界会怎样
□ 文/本刊记者 罗 超
对于这个没有边界的监控智能化概念,当智能视频分析遇上AI之后,我们在新时期对监控智能化有了新的指标,那就是会深度学习。
早在8年前,行业就在谈论监控智能化,但智能化的概念较为模糊,不像网络和高清监控,有明显的技术指标。对于这个没有边界的监控智能化概念,当智能视频分析遇上AI之后,我们在新时期对监控智能化有了新的指标,那就是会深度学习。
从广义上来说,智能视频分析技术主要包括以下三类:
频分析类
该类主要是在监控图像中找出目标,并检测目标的运动特征属性(如目标相对的像素点位置 ,目 标 的 移 动 方 向 及 相 对 像 素 点 移 动 速 度 ,目标本身在画面中的形状及其改变),根据以上的基本功能,视频分析可分为以下几个功能模块:周界入侵检测、目标移动方向检测、目标运动、停止状态改变检测、目标出现与消失检测、人流量、车流量统计、PTZ自动追踪系统、系统智能自检功能等。
视频识别类
该类包括人脸识别、步态识别与车牌识别,其主要技术是在视频图像中找出局部中一些画面 的 共 性 ,如 人 脸 必 然 有 两 个 眼 睛 ,如 果 可 以 找到双目的位置,那么就可以定性人脸的位置及尺寸。
视频改善类
该类主要是针对一些不可视、模糊不清,或者 是 对 振 动 的 图 像 进 行 部 分 优 化 处 理 ,以 增 加 视频的可监控性能。具体包括:红外夜视图像增强处理、车牌识别影像消模糊处理、光变与阴影抑制处理、潮汐与物体尺寸过滤处理、视频图像稳定系统等。
从实现方式来看,智能视频分析技术目前有两种常用方式:第一种是基于智能视频处理器的前端解决方案;第二种是基于监控的后端智能视频分析解决方案。基于视频处理器的前端解决方案:所有的目标跟踪、行为判断、报警触发都是 由 前 端 智 能 分 析 设 备 完 成 ,只 将 报 警 信 息 通 过网 络 传 输 至 监 控 中 心 。优 点 是 :视 频 分 析 设 备 被放 置 在 I P 摄 像 机 之 后 ,这 样 可 以 有 效 地 节 约 视 频流 占 用 的 带 宽 ;缺 点 是 :价 格 昂 贵 ,安 装 复 杂 ;前端设备分散、易损率高;报警记录与视频监控分开。
传统的视频监控系统通常是通过人员监控和录像来实现安全防护,实际上并不能主动有效地 保 障 安 全 ,尤 其 是 监 控 点 过 多 的 时 候 ,人 员 监控根本无法顾及所有监控场景;同时,监控人员的注意力很难保证二十四小时都能准确高效地监控所有监控场景;此外,被动录像通常只能在事 件 发 生 之 后 通 过 调 用 录 像 进 行 回 放 取 证 ,一 方面损失已经 产生不 可能 挽回,另一方面,通 过 人工 回 放 录 像 取 证 的 方 式 效 率 十 分 低 下 。智 能 分 析视频监控则可以有效地解决以上问题。智能监控的主要特征是采用计算机视觉方式,在几乎不需要人为干预的情况下,通过对摄像机拍录的图像序列进行定位、识别和跟踪,并在此基础上分析和判断目标的行为,从而做到既能完成日常管理又能在异常情况发生的时候及时作出反应,智能监控的主要优势有:群体行为分析、入侵检测和运动目标跟踪、有效扩展视频资源的用途、滞留物和搬移物报警、对摄像机保护、降低人力成本。
智能视频分析成为了安防行业必要的技术之一,然而,安防行业解决方案提供商不仅要解决用户安全的问题,还要进一步为行业用户的业务系 统 提 供 支 撑 。而 要 实 现 用 户 的 这 些 诉 求 ,就 离不开智能视频分析技术的支持。不过受限于智能分析算法本身的完善性,以及对应用场景的高要求等因素,智能分析的准确率受限。而随着大数据、云计算技术在安防领域的应用,深度学习技术具备了应用的条件,大数据可以为深度学习提供足够多的训练样本,而云计算则为深度学习的复杂算法模型提供了足够的计算能力支撑。
人 工 智 能 ,为 安 防 行 业 装 上 了 会 思 考 的 大 脑 。其应 用一方面提高了一些算法的准确率;另一方面,监控智能分析无法实现的功能,人工智能也可以实现。比如,人脸识别包括了人脸检测、特征点定位、特征比对等多个环节,如果采用深度学习 方 ,各 个 环 节 的 识 别 性 能 都 有 大 幅 提 升 。此 外 ,通过人工智能还可以将表情、年龄、饰品以及偏娱乐的颜值、开心程度等做得更好。再如人群分析方面,传统的监控智能分析是无法处理300人以上的大范围场景的,更不用提运动场景的人群分析 。现 在 基 于 人 工 智 能 ,不 仅 能 够 处 理 大 范 围 场景及运动场景的人数统计,还可以估计人群密度、滞留分析等,为一些用户提供增加商情效益分析的数据。
在公安行业,围绕公安业务需求的公安实战平 台 ,结 合 视 频 图 像 侦 查 业 务 ,对 监 控 画 面 中 感兴趣的目标视频进行智能分析,提取可疑的人、车、物等目标信息,生成结构化的语义描述,从而实现特定目标的快速定位、查找和检索。人工智能在视频内容的特征提取、内容理解方面有着天然 的 优 势 。前 端 摄 像 机 内 置 人 工 智 能 芯 片 ,可 实 时分析视频内容,检测运动对象,识别人、车属性信息,并通过网络传递到后端人工智能的中心数据库进行存储。汇总的海量城市级信息,再利用强大的计算能力及智能分析能力,人工智能可对嫌疑人的信息进行实时分析,给出最可能的线索建议,将犯罪嫌疑人的轨迹锁定由原来的几天,缩短到几分钟,为案件的侦破节约宝贵的时间。其强大的交互能力,还能与办案民警进行自然语言方式的沟通,真正成为办案人员的专家助手。
基于人工智能的视频智能分析是利用计算机图像视觉处理、模式识别和机器学习等算法,分析和识别运动目标信息。作为公安实战平台中最为 重 要 的 环 节 ,基 于 人 工 智 能 的 人 脸 识 别 技 术 需求应用更为迫切。公安部门借助人脸卡口IPC摄像 机 的 智 能 人 脸 检 测 技 术 ,在 城 市 道 路 、广 场 、娱乐场所及各类重点场所的人员目标的人脸识别,提取包括人的性别、戴眼镜、年龄段等特征信息。从而实现人脸的实时布控、高危人员比对、以图 搜 图 、语 义 搜 索 等 方 面 的 业 务 应 用 。比 如 ,人 脸布控业务是通过对场景中视频的进行实时人脸采集和视频分析,并与各种人脸库提供的图片(警综、信综、出入境、人口库、追逃库、犯罪人员库等)进行实时比对。如果发现重点关注人员,将推送到公安实战平台客户端或手机终端。另外公安实战平台与全国人口库、常住人口库、居住证人口库等数据关联,实现城市地铁、机场、酒店的人脸识别系统的联动。结合地图业务应用,可实现轨迹 回 放 、告 警 、查 询 的 可 视 化 。
智能视频分析目前主要还是集中在人和车的识别应用。
车辆识别
随着车辆的不断增长,智能视频分析结合人工智能成为人们关注的重点,可以有以下改善。其一,车牌的识别率有了显著的提高;其二,可以识别车子的其他特征,例如品牌、型号(市面上99%+的车型)、颜色等,结构化更多元、更系统;组 合 多 种 元 素去 搜 索,提 高 车 辆 搜 索 的 命 中 率 。
那为什么智能视频分析结合人工智能可以赋予车辆识别更多功能、更好效果呢?不断训练——用模型去识别拥有不同种类特征的sample群,就会获得不同的识别功能。比如:预算有限、识别准确率要求没有那么高,可以通过降低帧率或分辨率,或者牺牲一定的算法计算资源,换取更 多 的 路 数 ,降 低 单 路 的 成 本 。例 如 ,把 1 0 8 0 P 的分辨率降低至720P,那么路数预计可增加至256路,单路成本直降25%。
如 果 只 是 传 统 的 智 能 视 频 分 析 技 术 ,对 于 人的体型、人种、年龄、长短发等的识别,是无法实现的。人的识别困难在于人的动作和状态都特别不同,但是智能视频分析结合人工智能可以处理一个画面中的多达80个人物,在40毫秒以内。类似扶手电梯、十字路口、商业中心广场、展会门口等有持续不断流动的人群的场所,也可以用人的识别功能检测,并且检测准确率可高达95%。可见,智能视频分析结合人工智能的层数与它需要辨识的特征复杂度有关系。
不可否认的是,现在全球智能视频分析结合人工智能的技术,还处于弱AI阶段,会有一些不足。比如,如果视频扑捉到了人的视频,就能检测到并进行分析,但画面上看不到的则没办法识别到、也不能做分析;如果画面上人物被遮挡一部分,则会影响检测和分析的效果。尤其是高峰期升降电梯、广场密集人群等。
此外,全球各地区的人种不同,AI识别率下降。大华认为,可以在定期输送各肤色人种样本,提高 AI 对更多皮肤色调的识别率。
综 上 所 述 ,一 言 以 蔽 之 ,当 智 能 视 频 分 析 搭上人工智能,世界将会怎样?