
大数据人脸分析案例
大数据人脸分析案例,随着社会科技的不断发展,人工技能,人脸识别技术也不断普及到各个领域。人脸识别技术可以在大数据的环境下,极大发挥其强大的作用。下文分享有关大数据人脸分析的内容。
大数据人脸分析案例1基于特征的方法和基于图像的方法
1、基于特征的方法
技术:基于特征的方法试图找到人脸的不变特征进行检测。其基本思想是基于人类视觉可以毫不费力地检测不同姿势和光照条件下的人脸的观察,因此必须有尽管存在这些变化的属性或特征是一致的。当前已经提出了广泛的方法来检测面部特征,然后推断面部的存在。
示例:边缘检测器通常会提取人脸特征,例如眼睛、鼻子、嘴巴、眉毛、肤色和发际线。基于提取的特征,建立统计模型来描述它们之间的关系并验证人脸在图像中的存在。
优点:易于实施,传统方法
缺点:基于特征的算法的一个主要问题是图像特征可能会由于光照、噪声和遮挡而严重损坏。此外,人脸的特征边界会被弱化,阴影会导致强边缘,这使得感知分组算法无用。
2、基于图像的方法
技术:基于图像的方法尝试从图像中的示例中学习模板。因此,基于外观的方法依靠机器学习和统计分析技术来找到“人脸”和“非人脸”图像的相关特征。学习的特征是以分布模型或判别函数的形式应用于人脸检测任务。
示例:基于图像的方法包括神经网络 (CNN)、支持向量机 (SVMi) 或 Adaboost。
优点:性能好,效率更高
缺点:难以实施。 为了计算效率和检测效率,通常需要降维。这意味着通过获得一组主要特征来考虑降低特征空间的维数,保留原始数据的有意义的属性。
人脸检测方法
已经引入了多种人脸检测技术。
1、开始阶段:人脸检测自 90 年代出现以来一直是一个具有挑战性的研究领域。
2000 年之前,尽管有很多研究,但直到 Viola 和 Jones 提出里程碑式的工作,人脸识别的实际性能还远不能令人满意。 从 Viola—Jones 的开创性工作(Viola and Jones 2004)开始,人脸检测取得了长足的进步。
Viola and Jones 开创性地使用 Haar 特征和 AdaBoost 来训练一个有希望的准确度和效率的人脸检测器(Viola and Jones 2004),这启发了之后有几种不同的方法。 然而,它有几个严重的缺点。首先,它的特征尺寸比较大。另外,它不能有效地处理非正面人脸和框外人脸。
2、早期阶段——机器学习:早期的方法主要集中在与计算机视觉领域的专家一起提取不同类型的手工特征,并训练有效的分类器以使用传统的机器学习算法进行检测。
这些方法的局限性在于它们通常需要计算机视觉专家来制作有效的特征,并且每个单独的组件都单独优化,使得整个检测流程往往不是最佳的。
为了解决第一个问题,人们付出了很多努力来提出更复杂的特征,如 HOG(定向梯度直方图)、SIFT(尺度不变特征变换)、sURF(加速鲁棒特征)和 ACF(聚合通道特征)。检测的鲁棒性,已经开发了针对不同视图或姿势分别训练的多个检测器的组合。然而,此类模型的训练和测试通常更耗时,并且检测性能的提升相对有限。3
3、最新技术 — 深度学习:近年来,使用深度学习方法,尤其是深度卷积神经网络 (CNN) 的人脸识别取得了显着进展,在各种计算机视觉任务中取得了显显著的成功。
与传统的计算机视觉方法相比,深度学习方法避免了手工设计的不足,并主导了许多著名的基准评估,例如 lmageNet大规模视觉识别挑战 (ILSVRC)。
最近,研究人员应用了 Faster R—CNN,这是最先进的通用对象检测器之一,并取得了可喜的成果。此外,CNN 级联、区域提议网络(RPN)和 Faster R—CNN 联合训练实现了端到端的优化,以及人脸检测基准,如 FDDB(人脸数据库)等。
主要挑战
人脸检测面临的困难是降低人脸识别准确率和检测率的原因。
这些挑战是复杂的背景、图像中的人脸过多、奇怪的表情、光照、分辨率较低、人脸遮挡、肤色、距离和方向等。
不寻常的面部表情:图像中的人脸可能会显示出意外或奇怪的面部表情。
照明度:某些图像部分可能具有非常高或非常低的照明度或阴影。
皮肤类型:检测不同人脸颜色的人脸检测具有挑战性,需要更广泛的训练图像多样性。
距离:如果到相机的距离太远,物体尺寸(人脸尺寸)可能太小。
朝向:人脸方向和相机的角度会影响人脸检测率。
复杂的背景: 场景中的大量对象会降低检测的准确性和速度。
一张图像中有很多人脸:一张包含大量人脸的图像对于准确检测率来说非常具有挑战性。
人脸遮挡:人脸可能会被眼镜、围巾、手、头发、帽子等物体部分遮挡,影响检测率。
低分辨率:低分辨率图像或图像噪声会对检测率产生负面影响。
人脸检测应用场景
人群监控:人脸检测用于检测经常光顾的公共或私人区域的人群。
人机交互: 多个基于人机交互的系统使用面部识别来检测人类的存在。
摄影:最近的一些数码相机使用面部检测进行自动对焦等等。
面部特征提取:可以从图像中提取鼻子、眼睛、嘴巴、肤色等面部特征。 、
性别分类: 通过人脸检测方法检测性别信息。
人脸识别:从数字图像或视频帧中识别和验证一个人。
营销:人脸检测对于营销、分析客户行为或定向广告变得越来越重要。
出勤:面部识别用于检测人类的出勤情况, 它通常与生物识别检测结合用于访问管理,如智能门禁。
大数据人脸分析案例22014年前后,随着大数据和深度学习的发展,神经网络备受瞩目,深度学习的出现使人脸识别技术取得了突破性进展。深度学习是机器学习的一种,其概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
区别于传统的浅层学习,深度学习的不同在于一方面通常有5层以上的'多层隐层节点,模型结构深度大;另一方面利用大数据来学习特征,明确了特征学习的重要性。
随着深度卷积神经网络和大规模数据集的最新发展,深度人脸识别取得了显著进展,基于深度学习的人脸识别技术可以通过网络自动学习人脸面部特征,从而提高人脸检测效率。
从人脸表达模型来看,可细分为2D人脸识别和3D人脸识别。基于2D的人脸识别通过2D摄像头拍摄平面成像,研究时间相对较长,在多个领域都有使用,但由于2D信息存在深度数据丢失的局限性,收集的信息有限,安全级别不够高,在实际应用中存在不足。
早在2019年,就有小学生手举照片“攻破”了快递柜的人脸识别系统。基于3D的人脸识别系统通过3D摄像头立体成像,由两个摄像头、一个红外线补光探头和一个可见光探头相互配合形成3D图像,能够准确分辨出照片、视频、面具等逼真的攻击手段。
根据使用摄像头成像原理,目前3D人脸识别主要有三种主流方案,分别是3D结构光方案(Structured Light)、时差测距技术3D方案(Time Of Flight,TOF)和双目立体成像方案(Stereo System)。基于3D结构光的人脸识别已在一些智能手机上实际应用,比如HUAWEI Mate 20 Pro、iPhone X。
2009年微软推出的Kinect(Xbox 360体感周边外设)则采用了TOF方式获取3D数据,颠覆了游戏的单一 *** 作,为人机体感交互提供了有益探索。双目立体成像方案基于视差原理,通过多幅图像恢复物体的三维信息,由于对相机焦距、两个摄像头平面位置等要求较高,应用范围相对于3D结构光和TOF方案较窄。
除了能够准确识人,精准判断捕捉到的人脸是真实的也至关重要。活体检测技术能够在系统摄像头正确识别人脸的同时,验证用户是本人而不是照片、视频等常见攻击手段。目前活体检测分为三种,分别是配合式活体检测、静默活体检测和双目活体防伪检测。
其中,配合式活体检测最为常见,比如在银行“刷脸”办理业务、在手机端完成身份认证等应用场景,通常需要根据文字提示完成左看右看、点头、眨眨眼等动作,通过人脸关键点定位和人脸追踪等技术,验证用户是否为真实活体本人。
人脸与人体的其他生物特征(如指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提。随着大数据和深度学习的不断发展,人脸识别效率显著提升,为远程办理业务的身份认证环节提供了可靠保障。
但与此同时,人脸信息保护、隐私安全等问题也应引起重视。随着《个人信息保护法》《数据安全法》及相关司法解释的出台,国家相关部门以及各种机构对个人信息安全问题的重视,有利于引导人脸识别技术的发展方向,为促进行业高质量发展、创造高品质数字生活提供有力支撑。
大数据人脸分析案例3人脸识别的应用场景在大范围扩展:
金融领域:远程银行开户、身份核验、保险理赔和刷脸支付等。人脸识别技术的接入,能有效提高资金交易安全的保障,也提高了金融业务中的便捷性。
智慧安防领域则是为了视频结构化、人物检索、人脸布控、人群统计等软硬件一体形态产品提供基础支撑,重点应用于犯罪人员的识别追踪、失踪儿童寻找、反恐行动助力等场景。实现重点人员的识别及跟踪,在公安应用场景中达到事前预警、事中跟踪、事后快速处置的目的。
交通领域主要包括1:1人脸验证和1:N人脸辨识,目前利用人脸核验验证技术的刷脸安检已进入普遍应用阶段,在高铁站、普通火车站和机场皆已大面积推广。
而应用1:N人脸比对技术的刷脸支付主要落地在地铁公交等市内交通,这种技术能够极大提高通勤人员的出行效率,释放大量的人力资源,提升出行体验。同时,人脸识别可以对交通站点进行人流监测,根据人员出行规律预测人流高峰,提前做好疏导预案。
民生政务方面,人脸识别在政务系统的落地,提升了民众的办事效率,公民可以不用窗口排队,实现自助办事,节省了因人工效率低下产生的耗时。部分政务还可以通过在线人脸识别验证,在移动端线上办理,减轻了“办事来回跑、办事地点远、办事点分散”的困扰。
智能家居方面,主要应用在安全解锁和个性化家居服务两个场景。
在线教育领域则是通过人脸识别查验学员身份,避免一账号多个人使用,给网校造成损失,另一用途是帮助在线课堂老师了解学生学习状态,弥补网络授课相较于传统授课在师生交流环节上的不足。
商业领域,利用人脸识别功能实现各种极具创意的互动营销活动。
凡事都有两面。即便拥有以上优势,因人脸暴露度较高,相比对其他生物特征数据更容易实现被动采集,这也意味着人脸信息的数据更容易被窃取,不仅可能侵犯个人隐私,还会带来财产损失。大规模的数据库泄露还会对一个族群或国家带来安全风险。
在南方都市报个人信息保护研究中心发布的《人脸识别应用公众调研报告(2020)》中,其对两万份调研报告进行统计,问卷中就“便捷性”与“安全性”设置了量表题,请受访者分别依据前述10大类场景中的使用感受进行打分。
1分为最低分,5分为最高分。结果显示,在安全性感受方面,受访者给出的分数则明显偏低,体现出他们对安全风险的忧虑态度。
在 CNN 出现之前,图像对于人工智能来说是一个难题,有2个原因:
图像需要处理的数据量太大,导致成本很高,效率很低
图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高
下面就详细说明一下这2个问题:
图像是由像素构成的,每个像素又是由颜色构成的。
现在随随便便一张图片都是 1000×1000 像素以上的, 每个像素都有RGB 3个参数来表示颜色信息。
假如我们处理一张 1000×1000 像素的图片,我们就需要处理3百万个参数!
1000×1000×3=3,000,000
这么大量的数据处理起来是非常消耗资源的,而且这只是一张不算太大的图片!
卷积神经网络 – CNN 解决的第一个问题就是「将复杂问题简化」,把大量参数降维成少量参数,再做处理。
更重要的是:我们在大部分场景下,降维并不会影响结果。比如1000像素的图片缩小成200像素,并不影响肉眼认出来图片中是一只猫还是一只狗,机器也是如此。
图片数字化的传统方式我们简化一下,就类似下图的过程:
假如有圆形是1,没有圆形是0,那么圆形的位置不同就会产生完全不同的数据表达。但是从视觉的角度来看, 图像的内容(本质)并没有发生变化,只是位置发生了变化 。
所以当我们移动图像中的物体,用传统的方式的得出来的参数会差异很大!这是不符合图像处理的要求的。
而 CNN 解决了这个问题,他用类似视觉的方式保留了图像的特征,当图像做翻转,旋转或者变换位置时,它也能有效的识别出来是类似的图像。
那么卷积神经网络是如何实现的呢?在我们了解 CNN 原理之前,先来看看人类的视觉原理是什么?
深度学习的许多研究成果,离不开对大脑认知原理的研究,尤其是视觉原理的研究。
1981 年的诺贝尔医学奖,颁发给了 David Hubel(出生于加拿大的美国神经生物学家) 和TorstenWiesel,以及 Roger Sperry。前两位的主要贡献,是“ 发现了视觉系统的信息处理 ”,可视皮层是分级的。
人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。下面是人脑进行人脸识别的一个示例:
对于不同的物体,人类视觉也是通过这样逐层分级,来进行认知的:
我们可以看到,在最底层特征基本上是类似的,就是各种边缘,越往上,越能提取出此类物体的一些特征(轮子、眼睛、躯干等),到最上层,不同的高级特征最终组合成相应的图像,从而能够让人类准确的区分不同的物体。
那么我们可以很自然的想到:可以不可以模仿人类大脑的这个特点,构造多层的神经网络,较低层的识别初级的图像特征,若干底层特征组成更上一层特征,最终通过多个层级的组合,最终在顶层做出分类呢?
答案是肯定的,这也是许多深度学习算法(包括CNN)的灵感来源。
典型的 CNN 由3个部分构成:
卷积层
池化层
全连接层
如果简单来描述的话:
卷积层负责提取图像中的局部特征;池化层用来大幅降低参数量级(降维);全连接层类似传统神经网络的部分,用来输出想要的结果。
下面的原理解释为了通俗易懂,忽略了很多技术细节,如果大家对详细的原理感兴趣,可以看这个视频《 卷积神经网络基础 》。
卷积层的运算过程如下图,用一个卷积核扫完整张图片:
这个过程我们可以理解为我们使用一个过滤器(卷积核)来过滤图像的各个小区域,从而得到这些小区域的特征值。
在具体应用中,往往有多个卷积核,可以认为,每个卷积核代表了一种图像模式,如果某个图像块与此卷积核卷积出的值大,则认为此图像块十分接近于此卷积核。如果我们设计了6个卷积核,可以理解:我们认为这个图像上有6种底层纹理模式,也就是我们用6中基础模式就能描绘出一副图像。以下就是25种不同的卷积核的示例:
总结:卷积层的通过卷积核的过滤提取出图片中局部的特征,跟上面提到的人类视觉的特征提取类似。
池化层简单说就是下采样,他可以大大降低数据的维度。其过程如下:
上图中,我们可以看到,原始图片是20×20的,我们对其进行下采样,采样窗口为10×10,最终将其下采样成为一个2×2大小的特征图。
之所以这么做的原因,是因为即使做完了卷积,图像仍然很大(因为卷积核比较小),所以为了降低数据维度,就进行下采样。
总结:池化层相比卷积层可以更有效的降低数据维度,这么做不但可以大大减少运算量,还可以有效的避免过拟合。
这个部分就是最后一步了,经过卷积层和池化层处理过的数据输入到全连接层,得到最终想要的结果。
经过卷积层和池化层降维过的数据,全连接层才能”跑得动”,不然数据量太大,计算成本高,效率低下。
典型的 CNN 并非只是上面提到的3层结构,而是多层结构,例如 LeNet-5 的结构就如下图所示:
卷积层 – 池化层- 卷积层 – 池化层 – 卷积层 – 全连接层
在了解了 CNN 的基本原理后,我们重点说一下 CNN 的实际应用有哪些。
卷积神经网络 – CNN 很擅长处理图像。而视频是图像的叠加,所以同样擅长处理视频内容。下面给大家列一些比较成熟的应用�:
图像分类、检索
图像分类是比较基础的应用,他可以节省大量的人工成本,将图像进行有效的分类。对于一些特定领域的图片,分类的准确率可以达到 95%+,已经算是一个可用性很高的应用了。
典型场景:图像搜索…
目标定位检测
可以在图像中定位目标,并确定目标的位置及大小。
典型场景:自动驾驶、安防、医疗…
目标分割
简单理解就是一个像素级的分类。
他可以对前景和背景进行像素级的区分、再高级一点还可以识别出目标并且对目标进行分类。
典型场景:美图秀秀、视频后期加工、图像生成…
人脸识别
人脸识别已经是一个非常普及的应用了,在很多领域都有广泛的应用。
典型场景:安防、金融、生活…
骨骼识别
骨骼识别是可以识别身体的关键骨骼,以及追踪骨骼的动作。
典型场景:安防、电影、图像视频生成、游戏…
今天我们介绍了 CNN 的价值、基本原理和应用场景,简单总结如下:
CNN 的价值:
能够将大数据量的图片有效的降维成小数据量(并不影响结果)
能够保留图片的特征,类似人类的视觉原理
CNN 的基本原理:
卷积层 – 主要作用是保留图片的特征
池化层 – 主要作用是把数据降维,可以有效的避免过拟合
全连接层 – 根据不同任务输出我们想要的结果
CNN 的实际应用:
图片分类、检索
目标定位检测
目标分割
人脸识别
骨骼识别
本文首发在 easyAI - 人工智能知识库
《 一文看懂卷积神经网络-CNN(基本原理+独特价值+实际应用) 》
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)