查看原文
其他

【兴业计算机】视频大数据深度:开启计算机的眼和脑

蒋佳霖/徐聪等 兴业计算机团队 2022-07-03
投资要点


需求旺盛,市场空间逾千亿。视频大数据分析又称智能视频分析,指的是依靠计算机算法,挖掘视频数据的利用价值,赋予计算机人眼“看”的功能和人脑“思考”的功能。我们判断视频大数据分析技术在政府、金融、商业、机器人、无人机、无人驾驶汽车等领域均有巨大的应用前景。单就安保领域来讲,未来对视频数据分析软件的投入预计会在200亿-300亿之间。如果算上其他领域的需求,预计行业空间至少在千亿以上。


视频大数据分析大致分为三个层次:目标检测、目标识别和行为理解。目标检测是将目标从背景中分离出来,把不相关的画面去掉,是视频分析的基础。目标识别回答了“是什么”的问题,大家熟知的人脸识别就是其中一种。目标的行为理解回答了“在干什么”和“将会干什么”的问题,是目标识别的高级阶段。


互联网和科技巨头云集,布局视频分析核心技术,特别是以深度学习为基础的计算机视觉技术。近年来,以深度学习算法为基础的计算机视觉技术的进步为视频大数据分析提供了强有力的武器,反过来,视频大数据也为机器训练提供了丰富的资源(大数据是人工智能的燃料)。该领域正处于萌发期,大公司和初创团队都有机会。由于先进的算法技术主要发端于学院,所以目前国内外专注于计算机视觉技术的团队主要来自于科研院所。


视频分析技术和云计算技术相结合,创新盈利模式。预计仍然会以项目制为主,但云计算的引入提供了更好选择。例如,视频监控即服务(Video Surveillance as a Service,VSaaS)模式、旷视科技的智能云平台、极视角的计算机视觉PaaS平台等都是按服务来收费。未来,计算机公司如果能实现基于视频数据的运营,切入到应用领域,将是商业模式的革命性进步。


A股相关公司具有渠道资源,理解客户需求,通过内生和对外合作提升技术能力,试图占据视频大数据行业的有利地形。国内涉足视频大数据的上市公司大部分与视频监控相关,本质上是下游客户对视频数据分析的迫切需求倒逼供应商提供相应技术水平的产品和解决方案。目前技术储备主要是靠内部研发和与外部研发团队合作(合资)获得。上市公司有客户资源,并且更好地理解行业客户的需求,如果相关技术能够跟上,会很有竞争力


受益标的:东方网力、佳都科技、汉邦高科、浩云科技、神思电子、北部湾旅

报告正文

一.行业驱动因素和应用领域 



视频大数据分析又称智能视频分析,指的是通过算法,高效处理海量非结构化的视频图像数据,实现对数据的快速检索、智能识别和理解。近年来,视频数据的价值逐渐得到大家重视,通过计算机替代人力来挖掘视频数据价值正成为数据所有者非常关心的问题。目前,视频大数据分析技术逐渐在政府、金融、商业等领域得到应用,甚至成为了无人机、无人驾驶汽车、VR、机器人等新兴领域的关键技术。


但是,技术的难度显而易见。视频数据除了具备一般大数据的典型特征,还具有数据维度更多、数据量更大、非结构化等问题。尽管计算机具有比人类大脑更好的记忆力(机器不会体力不支或者遗忘),但是分析能力远远落后于人类。一个二三岁的小孩,我们只需要一个场景或者一张照片就可以教会他“小狗是长啥样的”,他下次碰到另一条狗(正常的狗),一般就能识别出来。但是,我们要让计算机学习“什么是狗”却是一件非常难的事情。在视频数据分析时,计算机需要区分视频图像里面的目标、识别出其行为特征甚至对其未来的行为进行预判,本质上是让计算机具有人类“眼睛”和“大脑”的功能,技术难度非常大。


一般而言,视频大数据分析技术主要集中于计算机视觉(Computer Vision)领域,而在13年以后,深度学习算法的进步极大提升了计算机视觉技术,使得视频数据分析有了更强大的工具。我们注意到,无论是IT巨头公司,还是具有一定研发能力的初创团队,近年来均开始在计算机视觉、深度学习领域进行布局。在上市公司层面,东方网力、汉邦高科、佳都科技、神思电子、浩云科技等公司也开始通过自主研发和对外合作等方式进军视频大数据分析领域。这类上市公司大部分是跟视频监控相关,主业是帮助下游客户建立视频监控系统。随着下游客户对视频数据分析需求的提升,需要这些公司提供相应的产品或服务。我们认为相关上市公司具有渠道资源,理解客户需求,通过内生和对外合作提升技术能力,占据视频大数据行业的有利地形。这篇报告我们对视频大数据分析行业进行了系统总结和分析,希望投资者能关注到该领域目前的投资机会。


1.1、驱动因素之一:累积的视频数据价值量巨大


我国现已具备高汽车保有量和成熟的移动互联网市场,同时用户消费习惯正在改变,对汽车性能、车载设施功能的需求在不断迭代升级,共享经济于国内外兴起。用户消费娱乐水平提升和社会发展都对车联网提出了更高的需求,作为承载车联网的智能硬件,智能汽车也将成为继智能手机后的又一超级终端,万物互联时代的重要组成部分。


从量的角度看,视频监控数据和互联网视频内容数据近年来有了大幅增加,为数据挖掘提供了丰富资源。据IDC的《The Digital Universe in 2020》报告,2012年全球有分析价值的数据中有一半是监控视频数据,这个比例在2015年上升到65%,速度是每两年翻一番。在国内,我们大约有3000万台监控摄像机,每月将生成60EB的视频数据,中国已经成为世界最主要的视频监控市场。




而在互联网上,随着移动互联网的快速发展,多媒体视频与图像应用越来越广泛。这些视频应用每时每刻产生海量的视频数据,目前已约占人们通讯数据量的80%,仅YouTube一个视频网站就拥有10亿用户,每分钟有300小时视频被上传,5000万小时视频被观看。在国内,网络视频用户超过5亿,其中手机视频用户有4.1亿。如果以25Mbps的1080i高清HD视频观看,5分钟1GB,每个月数据1.38EB可以观看14000年。




从质的角度看,随着监控技术往高清化、网络化、智能化发展,高分辨率和高帧率已成为视频监控主流需求。视频数据的质量越高,其分析价值越大。 


1.2、驱动因素之二:技术的成熟


以深度学习算法为基础的计算机视觉技术的进步,为视频大数据分析提供了强大的计算和分析工具。反过来,巨量的视频数据也为机器训练提供了丰富的素材,“大数据是人工智能的燃料”。




1.3、驱动因素之三:政策的推动


近年来,在平安城市的建设框架下,摄像头等硬件设备的普及率明显上升,后台监控平台软件也得到了一定程度的应用。但是,目前阶段,仍然存在数据分散、分析不到位的问题,大部分数据仍然躺在角落里而没有被利用,视频数据的价值没有得到充分的挖掘和利用。


政府已经意识到数据的价值,希望能够使用视频数据降低人工投入,提高社会管理的能力。目前,政府正大力推进“大联网”战略。“大联网”战略的第一步是公安系统的视频图像联网:2012年,公安部发布《安全防范视频监控联网系统信息传输、交换、控制技术要求》,要求争取到2015年要实现全国公安机关视频图像联网调度和资源共享。公安系统的监控来源一般分为公安部门的治安监控摄像机、交警部门道路监控摄像机、城管部门的城管监控摄像机等,公安大联网就是要求公安系统里面的各个监管来源能够统一起来。从目前的执行情况看,一二线城市已经做得很好了,主要的增量来源于三四线城市。“大联网”战略的第二步是要将社会资源监控并入公安监控平台。2015年5 月6 日,发改委联合八部委发布《关于加强公共安全视频监控建设联网应用工作的若干意见》(简称“若干意见”)要求将社会监控资源(如商业机构的监控信息也要与公安部的平台进行联网)并入公安联网平台,并要求逐步建立国家级和省级公共安全视频图像数据处理分析中心,深化视频图像信息预测预警、实时监控、轨迹追踪、快速检索等应用。要实现“大联网”战略的第二步,需要对原有监控平台进行升级改造,这一块进展才刚刚开始。


同时,随着硬件和基础软件平台渗透率的不断提升,用户对视频监控系统的关注点已经从单纯的系统建设,向运营、管理、应用,尤其是实战应用方面发展,要从现在的“看得见”进步到“看得懂”。从客户类型结构看,原来平安城市更多是来源于交警部门和公安部门的建设需求,未来政府的其他部门如刑侦、交通运输部门、司法等行业在视频监控管理与应用上的需求也会涌现。例如,公安部在15年6月《全国公安刑事技术视频侦查装备项目建设任务书》中对视频侦查领域进行了规划及管理。任务书明确将视频侦查纳入继网侦、刑侦、技侦之后公安机关第四大侦查手段。未来5年内会投入100亿左右的专项资金在省、市、县视频侦查示范工作室的建设上。




1.4、应用领域:政府


政府对视频智能分析的需求一方面体现在平安城市框架下安防和案件侦查对存量和更新视频数据分析的迫切需求,另一方面体现在交管领域对车牌识别、违章行为识别的分析需求。


安防和案件侦查利用视频大数据分析可以大大降低公安干警的人力投入,提高办案效率。在以往的一些案件中,比如2012年在南京发生的“1•6”抢劫案和“8.10重庆枪击抢劫案”(周克华案),警方都动用了上千的公安干警进行原始的视频数据人眼搜索,严重影响公安部门破案的进度和效率。而通过计算机自动查找、识别视频信息的优势显而易见,相关技术在该领域的应用前景非常巨大。目前国内的上市公司如东方网力等均在尝试用视频大数据技术帮助客户更好、更加智能地进行监控,更加快速地利用视频数据找到目标。




交管领域对视频大数据分析的需求同样迫切。例如,一线城市普遍实行了限行措施,这就需要靠计算机对车牌信息进行自动识别。再比如,深圳最近在某些主干道实现多人乘车专用道路,只有副驾驶座上有乘客的车辆才能在规定时间行驶在专用车道上,这个时候就需要摄像机能够识别副驾驶座上的人员信息。在实际操作中,经常会出现强光照、大侧角、模糊等极难条件,准确识别车牌关键信息、实现各种场景下车型的精准识别都具有一定的技术挑战。




1.5、应用领域:金融


金融领域的应用主要体现在两点,一方面是银行监控,需要计算机主动提前识别网点的异样信息,这与政府领域的安防监控应用类似,另一方面是人脸识别在银行、证券远程开户上的应用。在远程开户时,金融机构可以通过智能终端在线上进行身份鉴权验证,使用人脸识别技术开户可以极大提升业务办理的安全性、时效性,并节省大量人力。




1.6、应用领域:商业


零售门店


在零售门店里,视频大数据技术可用于客流统计、消费者心理和行为分析。通过客流统计数据,分析不同区域、通道的客流和顾客滞留时间,与销售业绩报表结合,可以分析顾客购买行为,顾客性别年龄组成。同时,还可以对顾客进行初步面部表情分析,初步了解客户的喜好特征,使得商家能够制定对应的营销策略。 



广告营销


视频大数据分析技术可以实现广告与客户需求更加精准的匹配。目前庞大的视频大数据资源已经吸引了包括BAT在内的国内外顶尖视频网站的涉足。阿里与优酷土豆的边看边买,百度和爱奇艺的随视购,以及腾讯视频、搜狐视频,芒果TV都陆续开始在视频画面中植入广告。通过大数据挖掘自动分析视频中的画面内容,并自动在视频中产生信息、标签、商品等内容,从而实现更精确的广告精准匹配,增加广告投放,实现将流量转换成营收的目标。同时还可以进行广告效果的监测,获得视频里面品牌曝光的次数、时长等。



互联网视频数据筛查


同样,视频大数据技术在网络黄暴盗版信息监测上也会节省大量的人力。2016年3月全国“扫黄打非”办公室、中央网信办、公安部、工业和信息化部、国家新闻出版广电总局等五部门联合下发通知,集中时间、集中力量全面开展打击利用云盘传播淫秽色情信息专项整治行动,着力治理利用云盘传播淫秽色情信息违法行为。目前在百度云盘、微盘、360云盘等云存储平台上,视频图像数据的存储量巨大,通过人工审核黄暴等信息会是一个非常消耗时间和人力的任务。通过视频大数据技术,可以精准识别出这些平台的色情、暴恐、小广告等违规图片或视频,能帮助开发者团队降低运营风险和法律风险,节省大量审核人力。例如图普科技就是基于深度学习图像识别技术,推出图像识别云服务,为企业提供各种图片/视频审核、增值、搜索服务。迅雷通过接入图普科技的图像识别云平台,超过98%的色情视频被机器过滤,复审量低于总量2%,节省了超过98%的人力成本。




1.7、应用领域:机器人等新兴行业


目前,在机器人、无人驾驶汽车、无人机、VR等新兴领域,智能视频分析技术正作为重要工具得到广泛应用。随着这些领域的发展壮大,视频大数据分析的应用场景会不断丰富。


家用机器人


家用机器人需要在密布的家居中实现自动清扫等功能,则需要依赖对周围的目标检测,避开障碍物,获取行动路径,完成系列动作。在更高级的阶段,需要通过相关算法,识别家庭成员的身份、面部表情、情绪变化,以此实现自主互动和情感交流。




视频大数据技术应用到超市机器人上,例如超市智能跟随机器人不仅可以根据用户的年龄和性别,进行精准的商品推荐,广告推送,优惠券推送,打折信息推送,跟随功能还可以彻底解放人们的双手。



无人机


无人机和视频大数据的结合可以做为一个数据采集和数据重构平台:无人机在高空中采集丰富的图像信息(地理信息,图形信息,图片,视频,光谱等),这个数据量非常巨大,利用视频大数据技术可以对采集的数据进行重构、识别等。


一方面,两者的结合可以用于真实地理目标构建和地图搭建。例如,无人机数据处理软件提供商Pix4D曾联合了无人机制造商Aeryon Labs以及巴西里约PUC大学,利用无人机为里约的标志性建筑高达30米的基督像进行高精度3D立体扫描,建立基督像的3D数字模型,有着非常高的精确度,误差在2-5 厘米左右。这类复杂场景高精度三维重建技术可以用于建筑古迹修复工作、大型建筑物3D数字模型建构,甚至是电影特殊场景的呈现。




另一方面,视频分析技术可以帮助无人机确定周围世界的基本属性和大致情况,避开障碍物,避免在高速情况下同其他无人机或飞机发生碰撞。目前亚马逊已经开展快递无人机项目,目标是30分钟在15英里范围内交付重量低于5磅(约合2公斤)的包裹,在2016年5月,亚马逊收购了一支由12名计算机视觉专家组成的团队,帮助解决无人机送货所面临的一些难题。



无人驾驶汽车


在无人驾驶汽车领域,视频大数据分析技术可以帮助汽车通过视频摄像头感知和识别行驶的车道上周边的物体,辨别车道和交通信号,检测出车辆、行人、树木等运动目标,防止事故的发生。



AR/VR


虚拟现实利用计算机技术从空间和位置上来模拟人类视觉、听觉、触觉甚至是嗅觉的感受,达到身临其境的效果。其中,模拟人类的视觉需要用到计算机视觉技术,两者天然就可以紧密结合。2015年,Oculus VR收购了英国计算机视觉公司 Surreal Vision,一家主要为AR提供实时逼真的3D场景视觉重现的新创公司。该公司通过使用彩色及深度摄像头,利用 3D 场景重建算法,提供实时逼真的周围环境视觉成像模型。 




.数据的采集、压缩和存储是视频大数据分析的前提



2.1、数据采集


视频数据往往是通过摄像机采集的。这一领域目前处于较为成熟的阶段,趋势是向高清化、网络化、真实化的方向发展。清晰度的高低往往决定了视频数据的价值大小,较高的清晰度可以降低视频处理和分析的难度。下图介绍了目前主流厂家的高清摄像机,其中不仅包括了常见的监控摄像头,还包括家用摄像机。




2.2、数据压缩

 

视频压缩的目的是为了保证在维持一定质量的前提下最大化视频压缩比。目前,全球视频数据总量每两年翻一番,但视频压缩效率每隔十年才提高一倍,所以迫切需要更有效的视频压缩方法以解决视频传输与存储等问题。目前,主要通过编码技术减少数据冗余的方式,最大化压缩比。现有高效视频编码主要研究可以归结为两类优化:一是如何进一步提高编码效率。二是如何有效降低编码复杂度。




2.3、数据存储


在视频监控领域,常见的视频存储设备有硬盘录像机(DVR)、网络视频录像机(NVR)以及存储区域网络(SAN)。其中,DVR适用于小型监控系统;NVR适用于远距离监控;SAN具有很强的存储扩展能力和故障隔离能力,适用于大规模监控网络的视频数据集中存储。


视频存储的发展方向是采用云存储系统来保存海量的视频数据。常用的云存储系统有开源的Hadoop分布式系统内置的HDFS文件系统,该存储系统会把一个完整的视频文件按固定大小分割为若干块,然后将各个文件块保存在不同主机的硬盘上,且提供数据块多机备份机制,提高了数据安全性。云存储系统能将异构存储设备组建成一个巨大的虚拟存储池,按需动态扩张存储容量,满足海量视频存储需求,提供TB级的视频输出带宽,而且由于云存储和云计算的紧密结合,可在视频大数据之上构建各种服务与应用。




.数据的采集、压缩和存储是视频大数据分析的前提



视频大数据分析需要解决三个层次的问题,一是目标检测和跟踪。目标检测是从背景中找出我们关心的物体,可以不知道“是什么”。高级的目标检测就是目标识别,因为其不仅把目标检测出来了,还知道了目标“是什么”。同时,检测出目标后,就可以通过其他技术手段实现目标跟踪。二是目标识别,解决的是“是什么”的问题。我们经常说的人脸识别属于该层次。三是行为识别(又称行为理解),解决的是“干什么”、“将要干什么”的问题,是一种高层次的识别。设想这样一个情景,在一帧视频内容里,我们首先需要把人从周围环境中分离出来(目标检测),然后分析出这个人是谁(目标识别),最后通过对其肢体动作的分析,得到他在干什么的结论,甚至推理出他将要干什么(行为理解)。这三个层次是依次递进的,目标检测是目标识别的基础,而行为识别是目标识别的高级阶段。




3.1、目标检测


目标检测指的是从图像中将运动变化区域分割提取出来。比如,图像中有个人在走动,我们关心的是这个人而不是旁边的建筑物、身后的天空等背景,所以需要进行目标检测,识别出图像中哪块区域是人的区域。一般的检测方法有背景减除法、时间差分法、光流法等。目标检测技术关键在于动态复杂场景中背景模型的建立、保持与更新,例如,图像中人在走动,但是旁边的树木因为风吹的原因叶子也在动,同时因为有阳光而出现人的阴影,这就导致了摇动的树叶与运动阴影也可能会被检测为人。




目标跟踪:根据目标的颜色、纹理和形状等信息来确定其在视频不同帧中出现的位置和区域。近年来有很多跟踪算法出现,如尔曼滤波、动态贝叶斯网络、粒子滤波器、基于光流Kanade-Lucas-Tomasi(KLT)算法等。影响目标跟踪的主要因素有目标自身阴影、目标之间相互遮挡或目标被背景中物体遮挡、多个目标之间具有较大相似性。目标遮挡仍是目前智能视频监控技术中较难处理的问题,特别是目标长时间被遮挡的情况。当出现遮挡现象时,目标只有部分可见,如何设计一个理想的遮挡模式下的跟踪模型是需要进一步研究的问题。




3.2、目标识别


目标识别(目标分类),主要是判断视频的内容是什么,例如通过人脸识别技术达到判定目的。过程是将待识别的目标与指定的目标库中的特征进行比较,以确定是否与该库中的某一目标相匹配。


目标识别的难度在于光照条件的改变、角度的不同、遮挡,人脸识别技术中还包括人脸表情的变化、年龄增长带来的变化。目标识别的方法主要有:几何特征法、神经网络法、隐马尔可夫模型法、利用人脸侧面像的轮廓进行识别等




3.3、行为理解


行为理解解决的是“干什么”、“将要干什么”,实现高层次的识别。例如,下图,在低层次的识别中,计算机会告诉我们这是马,这是人,这是狗(目标识别)。但是,这样的识别远远不够,设想下如果是个人看到这图片,大脑不会刻板地分门别类识别,它的反映是 “一个人骑在一匹马上,他的狗坐在马前面”,特别是,大脑还识别出了人和狗的情绪。所以,高级别的识别需要我们对目标行为进行理解,它需要计算机告诉我们 “在一个阳光明媚的下午,一个穿着牛仔衣服的年轻小伙坐在一匹健壮的马上,他的爱犬坐在马的前面”。




行为理解对数据分析结果的应用极其重要,因为其回答了目标“将要干什么”的问题,是可以基于理解的结果进行预判。例如,在地铁,广场等公共场所,在各种光照变化、人群遮挡等复杂环境下,相关机构可以通过视频数据分析,估计人群数量和密度,同时检测人群过密、异常聚集、滞留、逆行、混乱等多种异常现象。实现重大活动、重要区域的人流统计与控制,并提供实时报警功能。




.数据的采集、压缩和存储是视频大数据分析的前提



在视频大数据分析的三个层次中,目前研究热点主要集中在目标识别和行为理解两大领域。学术界和产业界最终的目的是让计算机具备人类眼睛和大脑的功能,“看到”并“领会”到图像和视频上的信息。具体技术手段上,往往采用计算机视觉(Computer Vision)技术,特别是以深度学习为基础的计算机视觉技术近年来在视频分析中得到广泛应用。

计算机视觉技术指的依靠算法,在没有其他辅助信息的前提下,仅根据图片像素信息分析出图像的语义。一般分为图像获取、预处理、特征提取、检测/分区和高级处理。




深度学习本质上是一种算法,通过模拟大脑的神经网络,使得计算机在某种程度上能够像人脑一样思考,它的主要特点是通过多层次的学习而得到对于原始数据的不同抽象程度的表示,进而提高分类和预测等任务的准确性。深度学习的概念源于人工神经网络的研究,是让计算机模拟大脑皮层神经网络的运作模式,达到计算机自己学习的目的。我们举一个例子大家就可以直观理解深度学习下的识别和一般技术条件下的识别有什么本质区别。例如,在人脸识别领域,之前的技术是通过预设条件,然后去识别目标图像,通过提取出来的特征跟预设条件去做对比来识别出某人。这种方式本质上是先告诉计算机某人应该是怎么样的(比如眉间距多少,五官的相对位置等)然后去识别。但是在深度学习条件下,我们不告诉计算机什么样长相的是某人,而是让计算机自己去学习某人有什么样的特征(拿很多关于某人的图像或视频去训练机器),然后总结出规律,最终实现精准识别。即传统的分析方法是人工选择特征,特征选择的好坏直接决定算法准确率。而深度学习减少了人工干预的步骤,让计算机自己去总结规律,通过多层迭代得到更优的特征。深度学习的实现思路与人脑的运作机理更加接近。




深度学习算法的突破大大促进了计算机视觉技术的发展,提高了计算机识别的效率和精确度。




4.1海外巨头公司扎堆布局深度学习技术


在今年的CES中,Orbeus(硅谷一家著名的图像识别公司)与AMD联手推出新的视频图像管理系统。同时发布了其基于深度学习(Deep Learning)的物体场景识别系统以及对应的iphone手机演示应用程序,该系统能够识别多于2000类的物体和场景。




近几年来在计算机视觉和深度学习领域涌现出了一大批极具发展前景和投资价值的初创型企业。他们分别在计算机视觉、深度学习、图像识别等领域形成自己差异化的竞争态势。从2014年以来,Google、Facebook等为代表的互联网公司和IBM代表的科技巨头纷纷通过并购进入该领域。




4.2、国内深度学习的案例


国内目前在深度学习领域走在最前列的是百度等互联网公司。2014年百度从谷歌挖来了吴恩达,进一步加强了其在该领域的研发实力。同时,很多创业型企业技术也不弱,比如商汤科技(Sense Time)、格灵深瞳、旷视科技、衣+等




这四家的技术都是基于深度学习算法的计算机算法技术,但产品定位和业务模式有区别。商汤科技的技术很强,其基于深度学习的人脸识别、文字识别、人体识别、车辆识别、物体识别、图像处理等技术在业界遥遥领先,客户分布广泛,都能合作。格灵深瞳主要是做智能视频分析的硬件,其产品基于三维深度视觉信号处理技术的视觉传感器网络,把三维深度视觉、深度学习、小型化高性能运算三个关键点做为计算机视觉的突破点。衣+提供了革命性的新方式来搜寻时尚商品并提供交易渠道,结合最新的计算机视觉识别、搜索和人工智能技术和时尚的社交网络,及时创造人和中意商品的连接。旷视科技目前主要是为了打造其智能视觉云服务。




.数据的采集、压缩和存储是视频大数据分析的前提



5.1、硬件销售


硬件(包括监控摄像机、存储器、编码器以及显示器等)一般涉及视频数据的采集、传输和存储,是大数据分析的基础设施。在视频大数据分析时代,硬件内置分析软件的模式会更加普遍。例如,格灵深瞳推出的两种产品皓目行为分析仪和威目车辆特征识别系统,都是以硬件为终端物理形态,集成了数据采集、分析的功能。皓目行为分析仪是一种基于三维视觉系统的安防监控设备,它可以理解视野范围内人的行动,精准检测复杂场景多个目标,是首款可跟踪40以上人数的行为分析仪,可以检测人数过多,逗留过久,异常接近等行为,并且能三维构建人体动作姿态,可主动交互行为分析,目前主要的客户是银行。威目车辆特征识别系统是用于可识别汽车的视觉系统,基于深度学习的新一代车辆识别引擎,以在线云服务、离线SDK、软硬一体的产品形式让企业级用户和直接业务部门可以快速应用最好的车辆识别技术,可以在复杂场景里进行多目标检测分类,可以不依赖车牌信息识别部分被遮挡或位于画面边缘的车辆,识别16种细分车型、3000多种车款、12种颜色,白天识别率大于95%,夜间识别率大于90%。




5.2、软件(解决方案)


那些专注于软件和平台开发的公司将最受益视频大数据时代。这些公司应该加强技术研发,尽早布局。目前,软件主要包括视频分析软件和视频管理软件(VMS)。视频分析软件包括视频追踪、动作识别、文本识别、面部识别等功能。根据HIS的估计,2015年-2020年视频分析软件市场年平均增长率高达38%。视频管理平台集视频显示、处理、分析和记录于一体,随着视频监控摄像机的增加,视频管理平台被广泛运用到管理不同摄像机,处理各种各样的数据。




在国内,东方网力、海康等上市公司已经在视频管理平台领域有较强的技术优势和稳固的市场地位。




5.3、云模式


视频监控即服务(Video Surveillance as a Service,VSaaS)完全在云端操作,是一套允许用户远程存储、管理、记录、播放和监测监控录像的网络托管无线安全系统。用户只需要一个网络摄像系统,就可以获得该服务。按照HIS的估算,2020年,VSaaS全球市场规模预计将达到45亿美元,增速在40%左右。





PaaS模式:


旷视科技打造智能视觉云服务,通过向下游客户提供人脸或者图像识别的服务来获得收入。例如,美图秀秀就是旷视科技“人脸识别云服务”的客户,美图秀秀不用自己开发相应的人脸识别模块,只需要接入旷视科技提供的API和离线引擎就可以享受现成的人脸检测、分析和识别等服务。这种模式区别于传统的项目制,具有非常好的盈利前景。


极视角科技是一家计算机视觉及大数据分析公司,是一家PaaS平台提供商。公司通过开放云端平台,为算法开发者提供开发环境、海量数据、架构支持等优质算法和解决方案。




5.4、视频大数据变现


计算机公司除了提供视频大数据分析的工具,还有可能通过与客户的合作,共同实现客户视频数据的变现,拓展新的商业模式。

客户购买计算机公司的产品或服务,可以满足自己视频分析的需要。但视频数据的价值仍然没有被充分挖掘。例如,政府掌握的视频数据可以用于监控和破案,也可以用于其它的商业领域。但政府作为非盈利机构,没有动力去进一步变现其数据价值。未来,技术公司可以通过与政府达成合作,在不违背公民隐私保护的前提下,进一步挖掘政府掌握的视频数据价值,获取商业利益。

上市公司东方国信目前致力于与运营商合作变现运营商的数据价值。这种模式也可以借鉴到视频数据领域。


5.5、市场空间测算


安防领域市场空间


目前阶段国内视频监控领域的投入大部分还是在硬件领域,视频分析和管理软件占比较低。我们预计未来对相关软件的需求会明显提升,该领域的投入将向视频大数据分析方向倾斜。按照相关资讯报告的测算,2015年全国视频监控市场(政府和非政府领域,其中政府支出占40%)空间有700多亿的规模,未来仍将保持一定的增速。如果其中有30%的比例投向视频分析领域,也将是200亿左右的市场容量。




从微观角度看,有些城市近年来披露的监控项目的投资,如石家庄、丽江等,主要是投向监控平台建设,规模在1.5个亿-2个亿不等,预计其中30%用于软件和解决方案的购买,差不多有4000万-5000万的规模。我们按照未来每个地级市投资5000万用于视频联网、视频数据管理和分析,则估算下来全国合计投入会在150亿左右。考虑到政府支出占整个安防领域的40%,则未来整个安防领域对视频分析需求的支出在300亿以上。



其他领域市场空间


其他领域,如金融、商业领域以及无人机、机器人、无人驾驶汽车、VR等新兴领域都需要用到视频分析技术,市场空间较大,但较难估算。按照《2015年中国大数据交易白皮书》的测算,2020年中国大数据应用市场规模将达到8000亿左右。其中预计软件和解决方案预计能占30%的比例(2015年该比例为25%),则2020年国内大数据分析软件和解决方案的规模在2000亿左右。考虑到视频数据占整个数据量的比例超过50%,则视频数据分析领域的软件和解决方案的市场规模至少是在千亿人民币以上。如果考虑基于视频数据分析结果的应用,则市场规模将成倍放大。





.数据的采集、压缩和存储是视频大数据分析的前提



国内相关上市公司往往是从事监控设备生产销售、平台软件开发和项目实施的公司,下游客户基本上集中在政府、金融等领域。随着下游客户对视频大数据分析的需求逐渐提升,这些公司逐渐开始布局相关技术。一般而言,采取的是内部研发和与外部研究团队合作(合资)相结合的模式。目前,龙头公司已经有了成熟的视频大数据的解决方案,目前已经应用到多个项目中。但是,我们正文里分析的高级识别仍然比较少见。同时,行业应用仍然主要局限在政府和金融领域,视频大数据应用的广阔空间仍然没有被打开。




6.1、东方网力:积极布局视频大数据和服务机器人项目 


公司在公安等领域有非常扎实的业务基础。2014年公司视频管理平台市场占有率全球第三、中国第一,主要产品有PVG网络视频管理平台、前端设备、网络硬盘录像机、轨道交通信息系统等。公司将持续受益于国内视频大数据分析需求的爆发(主要是政府领域)


智能视频分析的技术能力已经很强。公司在主业上积累了较强的视频内容分析算法经验,同时又积极与商汤科技合作,技术能力非常超前


技术应用将拓展至机器人领域。视频大数据技术除了可以应用至公司的视频管理平台上,还可以应用至机器人领域。公司在家用机器人和商用机器人领域已经布局,在机器人视觉技术方面与硅谷的团队进行研发,进一步增强公司的技术能力和应用化能力


2016年非公开增发计划募资总额18.3亿元,其中14.2亿投向“视频大数据及智能终端产业化项目”。视频大数据及智能终端产业化项目由公安大数据分析应用平台、视图机器识别云服务平台、视频云联网服务平台、警用智能硬件四部分组成。该项目拓展了公司传统平台在大数据、云计算、人工智能技术中的运用,增加了视频平台运用场景。项目达产后,预计每年可实现营业收入12亿元,增加净利润2.4亿元。


6.2、佳都科技:发力视频大数据,爆发巨大潜力


公司在安防领域深耕多年,有很好的客户优势。


参股云从科技,持有18%股份,争夺人脸识别市场。云从科技是专注于计算机视觉与人工智能的高科技企业,核心技术源于四院院士、计算机视觉之父——Thomas S. Huang黄煦涛教授,有中国科学院和上海交通大学两个支点提供强大技术力量支撑,拥有“双层异构深度神经网络”、“动态场景实时解析”、“自适应实时多目标跟踪”等多项核心技术,以及“云之眼人脸识别服务引擎”、“动态人脸识别系统”等人脸识别智能系统和设备。




6.3、浩云科技:专注金融安防,深入研究视频大数据智能分析


公司是国内领先的金融安防行业解决方案提供商,主要为银行客户提供个性化整体安防解决方案,主营业务为金融安防系统设计、集成和运维服务,以及相关软、硬件产品的研发、生产和销售。


2016年非公开发行募集资金6.8亿元。其中2.28亿元投入视频图像信息大数据及深度智能分析系统产业化技术改造项目,产品主要包括大规模图像近似检索系统、海量视频多媒体关联分析系统、视频数据(监控系统)安全保护系统、图像信息联网共享系统、深度智能分析系统等,可应用在安防领域进行海量视频图像的快速检索。通过本次非公开发行,公司打造视频大数据等具有较高技术门槛的核心产品,打开发展空间。预计项目达产后,年平均净利润达5000万元


6.4、汉邦高科:进军智能驾驶领域


公司是国内最早进入数字视频监控行业的公司之一,一直专注于数字视频监控领域的产品和技术研发,在提供产品和技术支持的同时提供行业系统整体解决方案。目前已成立金融行业、智慧城市和智能楼宇三个专业事业部,重点发展高清摄像机产品线和监控系统。


在人脸检测等领域有不错积累,目前有主要技术30余项,正从事的研究项目10余项。在智能化技术领域不断推进,通过内生外延的发展方式,拓宽公司产业链,向更多元化的智能化应用场景延伸。


2016年5月,汉邦高科及其管理层发起成立的产业基金与北京文通图像识别技术研究中心有限公司共同出资4000万元设立北京飞识科技有限公司,其中产业基金出资2800万元,持股比例为70%。飞识科技主要从事人工智能技术在智能监控及自动驾驶等领域的研究和应用,研究方向包括人脸识别、行为识别、视频浓缩、模糊检索、ADAS辅助驾驶系统等,发展潜力巨大。北京文通图像识别技术研究中心有限公司是一家由清华大学的模式识别专家创建的高科技企业,拥有国际领先的模式识别技术。公司股东和高管均具有清华大学博士及以上学历,包括北京康易科技有限公司(持股比例为86%)、丁晓青(持股比例为10%)和陈彦(持股比例为4%),其中康易科技的实际控制人为清华大学博士王丽婷




6.5、北部湾旅:收购博康智能,进军智慧旅游+大数据领域


公司主要从事海洋旅游及健康旅游业务,依托自身在旅游行业的运营经验,收购智慧安全+智慧交通公司博康智能,依托其技术优势打造智慧出行+智慧景区等智慧旅游项目,并进军大数据领域。


博康智能拥有“图像解析及内容检索关键技术”、“数据管理及挖掘应用关键技术”“大数据应用技术”三大核心技术。图像解析及内容检索关键技术基于人工智能、计算机视觉、视频图像处理等技术,以深度学习技术为核心,可实现图像内容解析和内容检索;大数据应用技术掌握了图像大数据关键技术,并推出了人脸大数据、卡口大数据、视频大数据等专题应用技术。增发募集配套资金10亿,用于打造智慧出行管理系统、智慧景区管理系统、行业大数据应用软件云租用服务系统、智慧云及主动感知的智能前端产业化基地。


6.6、神思电子:从身份识别领域向生物识别领域拓展

公司是身份识别领域解决方案的提供商和服务商,以二代身份证验证机具行业应用为业务切入点,专注智能卡应用技术、生物特征识别技术、电子支付技术等应用技术研究,并密切跟踪移动互联、大数据处理、智能视频分析、数字城市与智能社区建设等新技术、新业态,架构差异化的行业解决方案,开发成功一系列具有自主知识产权的智能终端与行业应用系统软件,在国内大部分省市区的金融、公安、通信、人社等行业实现批量商用。


在生物特征识别领域坚持人脸识别研究,及时引入深度学习研究方法,2105年底公司人脸识别算法水平大幅提升,已接近国内最高水平。公司的人脸识别技术已经成功地植入多个系统解决方案等创新型产品。


和上海依图共同投资设立神思依图公司,将主要从事视觉认知解决方案产品,共同合作推进人工智能、身份识别与云计算的深度融合。上海依图以“变革人机视觉交互”为目标,致力于计算机视觉、图像视频智能理解和分布式系统及大数据应用的研究,是目前全球唯一能对人脸以及车辆都进行精确识别的公司。神思电子提供智能终端硬件设备,占51%的股权;上海依图提供软件,占49%的股权。



(注:此文原创于2016年6月16日,By 兴业计算机 袁煜明/蒋佳霖/徐聪等)

联系人:

蒋佳霖 18614021551

徐   聪 18018726086

孙   乾 15201966173

吴鸣远 15601668682

冯欣怡 15109111151

注:文中报告节选自兴业证券经济与金融研究院已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。

证券研究报告:视频大数据:开启计算机的眼和脑

对外发布时间:2016年6月16

报告发布机构:兴业证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)

本报告分析师:

蒋佳霖  SAC执业证书编号:S0190515050002


徐  聪  SAC执业证书编号:S0190516060001


自媒体信息披露与重要声明

本信息材料仅为对公开资料的整理信息,不涉及分析师的研究观点及投资建议。

使用本研究报告的风险提示及法律声明

兴业证券股份有限公司经中国证券监督管理委员会批准,已具备证券投资咨询业务资格。

本报告仅供兴业证券股份有限公司(以下简称“本公司”)的客户使用,本公司不会因接收人收到本报告而视其为客户。本报告中的信息、意见等均仅供客户参考,不构成所述证券买卖的出价或征价邀请或要约。该等信息、意见并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对任何人的个人推荐。客户应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见。对依据或者使用本报告所造成的一切后果,本公司及/或其关联人员均不承担任何法律责任。

本报告所载资料的来源被认为是可靠的,但本公司不保证其准确性或完整性,也不保证所包含的信息和建议不会发生任何变更。本公司并不对使用本报告所包含的材料产生的任何直接或间接损失或与此相关的其他任何损失承担任何责任。

本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌,过往表现不应作为日后的表现依据;在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告;本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。

除非另行说明,本报告中所引用的关于业绩的数据代表过往表现。过往的业绩表现亦不应作为日后回报的预示。我们不承诺也不保证,任何所预示的回报会得以实现。分析中所做的回报预测可能是基于相应的假设。任何假设的变化可能会显著地影响所预测的回报。

本公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。本公司没有将此意见及建议向报告所有接收者进行更新的义务。本公司的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。

本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。未经授权的转载,本公司不承担任何转载责任。

在法律许可的情况下,兴业证券股份有限公司可能会持有本报告中提及公司所发行的证券头寸并进行交易,也可能为这些公司提供或争取提供投资银行业务服务。因此,投资者应当考虑到兴业证券股份有限公司及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突。投资者请勿将本报告视为投资或其他决定的唯一信赖依据。


投资评级说明

报告中投资建议所涉及的评级分为股票评级和行业评级(另有说明的除外)。评级标准为报告发布日后的12个月内公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅,A股市场以上证综指或深圳成指为基准。

行业评级:推荐-相对表现优于同期相关证券市场代表性指数;中性-相对表现与同期相关证券市场代表性指数持平;回避-相对表现弱于同期相关证券市场代表性指数。

股票评级:买入-相对同期相关证券市场代表性指数涨幅大于15%;审慎增持-相对同期相关证券市场代表性指数涨幅在5%~15%之间;中性-相对同期相关证券市场代表性指数涨幅在-5%~5%之间;减持-相对同期相关证券市场代表性指数涨幅小于-5%;无评级-由于我们无法获取必要的资料,或者公司面临无法预见结果的重大不确定性事件,或者其他原因,致使我们无法给出明确的投资评级。


免责声明

市场有风险,投资需谨慎。本平台所载内容和意见仅供参考,不构成对任何人的投资建议(专家、嘉宾或其他兴业证券股份有限公司以外的人士的演讲、交流或会议纪要等仅代表其本人或其所在机构之观点),亦不构成任何保证,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主做出投资决策并自行承担风险。根据《证券期货投资者适当性管理办法》,本平台内容仅供兴业证券股份有限公司客户中的专业投资者使用,若您并非专业投资者,为保证服务质量、控制投资风险,请勿订阅或转载本平台中的信息,本资料难以设置访问权限,若给您造成不便,还请见谅。在任何情况下,作者及作者所在团队、兴业证券股份有限公司不对任何人因使用本平台中的任何内容所引致的任何损失负任何责任。

本平台旨在沟通研究信息,交流研究经验,不是兴业证券股份有限公司研究报告的发布平台,所发布观点不代表兴业证券股份有限公司观点。任何完整的研究观点应以兴业证券股份有限公司正式发布的报告为准。本平台所载内容仅反映作者于发出完整报告当日或发布本平台内容当日的判断,可随时更改且不予通告。

本平台所载内容不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见。







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存