📄 基于小波分析和主成分分析的人脸识别研究.doc
字号:
了不同视点下的人脸匹配和识别问题,Veter等人讨论了由单幅人脸图像生成其他视
点的人脸图像的可能性,Mithosseini等则探讨了多种信息融合的人脸识别方法。
1.2.2人脸识别研究发展回顾
对人类自身识别目标过程的认识。上世纪80年代以来,心理学家、神经生理
学家和工程技术人员对人和及其如何识别人脸的各个方面进行了广泛的研究。心
理学家、神经生理学家主要对人脸的唯一性、识别人脸是在整体特征还是在局部
特征下进行、表情分析及其在人脸识别中的应用、婴儿怎样理解人脸、人脸记忆
的组织结构等。其主要结论是人脸识别是大脑中一个特有的过程。总体上有以下山东大学硕士学位论文
几点:第一,在人脸感知和识别过程中,局部和整体特征都起到一定的作用,但
是若存在明显的局部特征时,整体特征将不起作用;第二,在正面人脸图像中,
鼻子对人脸识别不起主要作用(但不是不起作用),但是在侧面人脸识别中,鼻子
对特征点的匹配很有作用;第三,上半部的特征比下半部特征所起的作用大,低
频成分对整体识别有用,高频成分对细节识别起作用;第四人脑的右半球对人脸
图像的识别起着重要作用,而左半球对语言的处理起重要作用;第五,儿童识别
人脸较多地采用显著特征,而较少地使用整体分析;第六,不同的种族、性别的
人脸识别的难易程度不同,这可能因为不同类型的人脸图像具有不同的特性。神
经生理学和心理学的研究结果无疑将非常有益于人脸识别技术的发展,但是除少
数文献外,机器识别人脸的研究还是独立于心理学和神经生理学的研究的。
人脸识别技术的发展。人脸识别研究工作可追溯到 1888年, FrancisGalton于
1910年在人脸侧面轮廓图象上所做的工作,所提出的方法主要集中于检测重要的
人脸特征或是关键点(keypoints),这里典型的关键点包括眼角、嘴角、鼻尖以及脸
颊等。接着计算这些关键点之间相应的距离,以此来构造一个表述单个人脸信息
的特征向量,通过对用上述方法生成未知人脸的特征向量和己知人脸的特征向量
集的比较,选出距离最小的作为识别的结果。该方法的缺点是对人脸的偏转十分
的敏感,即使是在控制的环境下也很难进行特征点的准确定位。
由于人脸正面图像包含了人脸更明显的特征,所以对人脸正面模式的研究最
多,它的发展可分为以下二个阶段:
第一阶段以Bertinon.Allen和Parke为代表,时间上从20世纪50到60年代,主要
研究人脸识别所需的面部特征。在Bertillon系统中,用一个简单的语句与数据库中
的某一张脸相联系,同时与指纹识别相结合,提供了一个较强的识别系统。为了
提高脸部识别率,Allen为待识别脸设计了一种有效逼真的摹写,Parke则用计算机
实现了这一想法,并且产生了较高质量的人脸灰度图模型。这一阶段工作的特点
是识别过程全部依赖于操作人员,显然不是一种可以完成自动识别的系统。
第二阶段是人机交互式识别阶段,时间是20世纪70年代,代表有
Goldstion.Harmon和Lesk等人。他们用几何特征参数来表示人脸正面图像,采用21
维特征矢量来表示人脸面部特征,并设计了基于这一特征表示法的识别系统。Kaya
和Kobayashi则采用了统计识别的方法,用欧氏距离来表示人脸特征,如嘴唇的高山东大学硕士学位论文
度,两眼之间的距离。更进一步的,Kanad设计了一个半自动回溯识别系统,创造
性的运用积分投影法从单幅图像上计算出一组脸部特征参数,再使用模式分类技
术与标准的人脸相匹配。总的说来,这类方法需要利用操作员的某些先验知识,
仍然摆脱不了人的干预。
第三阶段是真正的向实用化发展的机器识别阶段,近十年来随着高速度高性
能计算机的发展,人脸模式识别方法有了较大的突破,提出了多种机器全白动识
别系统。
近年来,人脸识别技术研究非常活跃,除了基于KL变换的特征脸方法与以奇
异值特征为代表的代数特征方法取得了新进展外,人工神经网络、小波变换技术
在人脸识别研究中都得到了很广泛的应用,而且出现了不少人脸识别的新方法。
1.2.3人脸识别的应用
如同人的指纹、掌纹、虹膜等特征一样,人脸也具有唯一性,可用来鉴别一
个人的身份。人脸识别的研究真正开始成为热点是从上世纪80年代末开始的,目
前全球相当数量的科研机构提出了各自的人脸识别的算法,同时也出现了一批人
脸识别的商业化产品。近年来,因为恐怖分子的破坏活动,特别是自美国gH事件
之后,包括人脸识别在内的生物特征识别再度引起人们的关注,各国也纷纷增加
了对该领域研发的投入。同其他的生物特征识别技术,如指纹、语音、虹膜、DNA
待识别相比,人脸识别具有被动、友好、方便的特点.其应用范围广泛,可应用于
以下的几个方面2。:
·嫌疑犯照片的识别匹配。当公安部门获得案犯的照片后,可以利用人脸识
别技术,在存储罪犯照片的数据库中找出最相像的人为嫌疑犯。还有一种应用就
是根据目击证人的描述,先由警察画家画出一草图,然后用这张图到库里去找嫌疑
犯。罪犯数据库往往很大,由几千幅图像组成。如果这项搜索工作由人工完成,
不仅效率低,而且容易出错,因为人在看了上百幅人脸图像后,记忆力会急剧下
降,而由计算机来完成则不会出现此问题。当然,如果没有正确的特征提取,而
盲目的进行人脸识别,势必将造成误判操作,造成不必要的损失。
·证件验证。身份证、驾驶证以及其他很多证件上都有照片,现在这些证件山东大学硕士学位论文
多是由人工验证的,如果用了人脸识别技术,这项工作就可以交给机器完成,从
而实现自动化智能管理。当前普通使用的另一类证件是用符号或条形码标记的,
比如信用仁等。这类卡的安全系数比较低,因为卡可能丢失,密码也可能被遗忘
或窃取。如果在这类卡上加上人脸的特征信息,则可以大大改善其安全性能。
·入口控制。入口控制的范围很广,它可以是设在楼宇、单位或私人住宅入
口处的安全检查,也可以是计算机系统或情报系统等的入口控制。在一些保密要
求非常严格的部门,除了用证件,还要加上另外一些识别手段,如指纹识别、手
掌识别、视网膜识别和语音识别等。人脸识别与之相比,具有直接、方别和界面
友好的特点。当前计算机系统的安全管理也备受重视,通常使用由字符和数字组
成的口令可能会被遗忘或破解,但是如果把人脸当作口令则又方便又安全。
·视频监视。在许多银行、公司、公共场合等处都设有24小时的视频监视。
另外侦察员在破案时有时也要用摄像机对人进行跟踪。在对图像进行集体分析时,
就要用到人脸的检测、跟踪和识别技术。
·除了这几部分的应用外,人脸识别技术还可用在视频会议、机器人的智能
化研究以及医学等方面。
3主成分分析(pCA)在人脸识别中的应用背景
特征提取是人脸识别系统中诸多组成部分的一员,也是最为重要的一个组成。
主成分分析(PCA)方法是目前应用最广泛的特征提取方法之一,也是一种统计学方
法,在信号处理、模式识别、数字图像处理等领域己经得到了广泛的应用。主成
分分析方法的基本思想是提取出空间原始数据中的主要特征(主成分),减少数据兀
余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的信
息,从而解决数据空间维数过高的瓶颈问题。
在人脸识别中,可利用PCA对人脸进行特征提取和特征选择。PCA算法将人脸
图像区域看作一种随机向量,利用K一L变换得到正交变换基,对应较大的特征值的
基底具有与人脸相似的形状。PCA算法利用这些基底的线性组合来描述、表达人
脸和逼近人脸,实现人脸图像的特征提取和特征选择,从而提高人脸的识别和重
建的效率。人脸识别就是把待识别的人脸映射到由特征脸张成的子空间中,与库山东大学硕士学位论文
中人脸的子空间位置进行比较。人脸的重建就是根据待识别人脸在子空间的位置,
还原到人脸空间中。但单一的P以算法的识别率并不高,因此通常可以在P以基础
上结合其它算法进行人脸的特征选择,以提高识别率。山东大学硕士学位论文
第二章人脸图像预处理
2.1概述
对图像的顶处理是图像识别中非常重要的一步,处理的目的是去除噪声,对
了J一川的信自、加强,并对输入测量仪器或其它因素所造成的退化进行补偿和熨原。
付j飞价态图像的人脸识别来说年龄、成像设备、人脸集大小、光照,偏转、表情
遮洛、竹是影iJIhj识别率的主要因素。而对于视频序列中的人脸识别,除了卜述的影
响队}素以外,还要依赖于在识别前的人脸检测的结果。不论静态图像或是动态的
视步印户列卜的人脸识别,人脸图像的预处理对于识别结果都起着很重要的作川
K一l_变换作为一种图像的统计方法,图像中所有像素均有同等的地位,同1人脸石
小同的光照强度下的成像差异反映到特征空间中会有较大的差异。所以角度、光
}吸、)泛寸及表情等「扰会导致识别率下降,从而导致误判。不同光照强度卜的同
一人脸成像如图2.!所小。
图2.1小同光照强度下的人脸图像
2.2人脸图像库
}涌寸用末U}}练和测试人脸检测和识别算法的图像库应用较多的大致如卜月山东大学硕士学位论文
列,这些图像库大部分是针对人脸识别问题建立的。
(1)Yale数据库,不同光照条件下,带有表情和眼镜的数据库,由巧个人的165
幅图像,数据库中的人脸图像的背景光线有一定变化,人脸的表情也不一样(包括
睁眼、闭眼、微笑、‘惊讶),一些人还有戴眼镜和不戴眼镜时的图像。
(2)BiolD数据库。该数据库是BiolD公司建立的,由23个人的 1521幅分辨率为
384x286的灰度图像组成,每幅图像只有一个人脸存在。该数据库专门用来测试人
脸检测算法,所以数据库图像环境变化比较大,光线明暗不同,人脸大小不一,
表情不同,背景也在变化。
(3)ORL数据库。该数据库是剑桥大学贝尔实验室1994年制作,用于测试人脸识
别算法的人脸图像数据库。该数据库包括40个人在不同时间拍摄的每人10幅图像,
共400幅256灰度级的图像,大小为 92x1120ORL数据库中的人脸图像的背景光线有
一定变化,人脸的表情也不一样(包括睁眼和闭眼,微笑和不笑),一些人还有戴眼
镜和不戴眼镜时的图像。
(4)NLPRFace数据库。该数据库是由中国科学院模式识别国家重点实验室建立的
一个人脸数据库。库中包括20个人的不同人脸图像各30幅,图像总数为600幅,大
小为320x24o。该数据库建立的目的是为了进行脸像分析的研究。数据库中人脸图
像分两次拍摄,有多种姿态:正面脸像、面内旋转脸像、深度旋转脸像,图像中
也包括了较多的背景。
(5)英国Manchester人脸数据库
该数据库由30个人的690幅图像组成,其中训练集和测试集分开,有不同的光
照和背景特征,而且对每个人而言,前后两张照片之间的时间间隔至少有三周。
训练集对光源有一定的约束,而在测试集中则无此要求。测试集还增加了两级难
度:其一是对于其中的相似人脸,有发型、背景以及戴眼镜等变化;其二是特征
遮挡,如头发、黑眼镜、手臂等。
2.3人脸预处理算法
本节的预处理工作是在BiofD和Yale人脸库上进行的,主要的预处理工作包括:
几何校正、直方图均衡化、像素灰度值归一化2。观察Bioid库可以发现,每个山东大学硕士学位论文
人的多幅图像中,对应的相同序列的图像(比如第一个人的第一幅和第二个人的第
一幅图像)中人脸位置都不相同,人脸的大小也不一样。尽管在建库时对成像距离、
光照以及被拍摄的人的位置作了严格的限定,但以上列举的这些因素是没有办法
避免的,所以通过预处理把人脸图像标准化的步骤是很重要的。下面详细讲述预
处理的各个步骤。
2:31几何校正
对于各种人脸识别的方法,人脸图像的标准化都是很重要的,对于最终的识
别结果也有着直接的影响。这里的标准化主要是指在各幅人脸图像中,人脸的关
键部位在图像中的相对位置是否都是一样的。文中所采用的PCA、LDA人脸识别算
法,都是直接利用整幅图像的信息用于识别的,对于不经过任何处理的原始图像,
人脸部位在图像中的位置都是有偏移的,这会影响人脸的正确识别。所以需要对
输入的人脸进行校正,以使不同输入情况下的人脸图像最后都统一到同样的大小,
并且人脸关键部位也尽量保持一致’4。
几何校正主要包括:缩放、旋转、翻转。
缩放:就是把的原始图像中包含的人脸缩放到统一的大小,依据Bioid库提供
的人眼坐标,采用定位和几何校正办法,能保证两眼间距离是相同的,从而其他
部位如鼻、嘴、脸颊等的位置也都保持在相对标准的位置。
旋转:就是把原始图像中人脸图像进行平面内的旋转处理,主要目的是使两
眼之间的连线保持在水平的位置。
翻转:主要是考虑到有的人脸图像可能存在上下颠倒的问题,这个问题可以
通过翻转来纠正,以使目标图像中的人脸保持正面。通过以上的缩放、旋转操作,
所有的人脸图像都规整为同样大小,两眼的连线也保持在水平的位置上,从而实
现了人脸图像的标准化。这样就解决了PCA、LDA算法下各图像中人脸位置不一
致对识别率造成的影响。
2.3.2人脸定位
Bioid人脸数据库中原始图像包含人体颈部、头发、整个前额、耳朵以及脸颊山东大学硕士学位论文
轮廓等对人脸识别不重要的特征信息,这些部分都属于干扰信息,对最终的识别
只会造成负面的影响。这里人脸定位就从背景中取出人脸区域,保留眼睛、鼻子、
嘴巴等关键部位。几何校正和人脸定位在本文中不做讨论。
2.3.3直方图均衡化及修正
直方图概念:直方图 (histogram)是灰度级的函数,它表示图像中具有每种
灰度级的象素的个数,反映图像中每种灰度出现的频率。如图2.6所不,灰度直方
图的横坐标是灰度级,纵坐标是该灰度级出现的频率。直方图反映了图像最基本
的统计特征。
直方图具有很多的优点2“,直方图能反映图像的概貌,比如图像中有几类目标,
目标和背景的分布如何:通过直方图可以直接计算图像中的最大亮度、最小亮度、
平均亮度、对比度以及中间亮度等。使用直方图可以完成图像分割、目标检索等。
因为不同的目标具有不同的颜色分布。使用归一化直方图作目标匹配,还不易受
到目标翻转和目标大小变化的影响。在图像查询的系统中,直方图有很大的应用,
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -