基于LBP 特征的面部表情识别方法
文/王强
摘要:如今,人的表情识别在智能
人机交互中发挥着越来越重要的
作用。本论文提出一种全自动识
别人脸七种基本表情的方法,该
方法首先利用局部二值模式提取
面部表情特征,然后用C 均值聚
类的方法对样本聚类得到表情模
板,最后使用K 近邻算法进行表
情图像的识别。通过采用日本的
JAFFE 表情数据库来检测算法的性
能,验证了方法的有效性。
【关键词】面部表情识别 局部二值模式 C 均
值 K 近邻
1 概述
人的表情识别在模式识别领域中受到广
泛关注,特别是从静态图像中识别表情比从图
像序列中进行难度更大。人的表情信息主要是
通过嘴巴、眼睛、眉毛等部位的变化体现出来
的,而这些变化体现在图像中就是图像边缘的
变化。而局部二值模式(LBP)能够有效的描
述图像的局部纹理信息,并且对由于光照引起
的灰度变化具有不变性。
2 提取面部表情的LBP特征
2.1 LBP
LBP 的原理是以一个像素点的灰度值作
为阈值,将这个点的3*3 邻域点的灰度值与它
进行比较,假设比阈值大的为1,比阈值小的
就为0,再以一定的顺序将它们连起来就得到
一串二进制数,二进制数转换成十进制数,就
得到了该点的LBP 值,这是基本LBP 算子。
然而基本LBP 算子的缺点是3*3 的邻域
太小,所以将基本LBP 算子扩展为任意邻域
大小的LBP 算子,记作LBPP,R。它是通过使
用圆形的邻域和双线性插值运算来实现的。
对LBP算子的进一步扩展是统一化模式,
通常记作。对于一个LBP 二进制位串,
如果其中从0 到1 或者从1 到0 的变化不多于
两个,则为统一化LBP 算子。然后对于图像
每一像素点的LBP 模式,如果是统一化模式
则赋值为1,不是统一化模式则为0,这就得到了整幅图像的LBP 直方图。
2.2 表情图像的LBP直方图提取
LBP直方图主要包含了图像的微小信息,
比如说边缘,点,但为了更好的得到图像的特
征,图像的空间特征也是必须的。因此我们将
表情图像划分成若干小的,不重复的区域,分
别计算每一小区域的统一化LBP 直方图,再
将各个小区域的统一化LBP 直方图连起来就
是整幅图像的LBP 直方图了。
3 C均值聚类算法和K近邻算法
本文首先使用了C 均值聚类算法对表情
进行聚类,得到表情模板。下面是C 均值聚
类算法的简单描述:首先,需要确定类别数C,
本文的类别数是7,分别代表高兴、生气、恐惧、
厌恶、害怕、悲伤和中性;然后随机选择训练
集中的C 个样本作为最初的质心;分别计算
训练集中其他样本到这C 个质心的欧式距离,
根据最近邻的方法,将这些训练集进行分类,
此时完成了第1 次迭代过程;接下来更新这7
个类的质心,得到新的质心后计算所有训练样
本到各个质心的欧式距离,根据最近邻法再将
所有点进行一次分类。就这样反复迭代,直到
达到预设的迭代次数为止。
识别的过程是采用K 近邻算法对每个测
试样本进行识别。K 近邻就是分别计算测试样
本与已知样本的距离,取前k 个近邻,看这k
个近邻中属于7 类表情中的哪类最多,那么识
别结果就是那一类。
总之,先采用C 均值聚类算法进行表情
的聚类,得到表情模板,在通过K 近邻算法
进行分类,这就是整个识别过程。
4 实验
实验是在日本女人表情数据库(Japanese
female facial expression,JAFFE)上进行的。
JAFFE 数据库共有213 幅表情图像,来自于10 个日本女人,每个人20 幅图像左右,每个
人7 种表情。
实验过程中,我们将这些图像分为10 个
部分,每个人的表情图像对应一部分。我们进
行了10 次实验,每次实验采用其中的9 部分
作为训练集进行训练,剩下的那一部分图像作
为测试集用来进行测试。最终得到10 个识别
结果,然后在计算出整个的平均识别率。结果
如表1 所示。
5 结论
本文所采用的方法在没有人工干预的情
况下,识别率达到了52.7%,相比其他要人工
选取基准点的方法取得了较好的效果。
参考文献
[1] Claude C,Chibelushi,Fabrice Bourel.
Facial expression recognition: A
brief tutorial overview[J].On-Line
Compendium of Computer Vision,2003.
[2] Caifeng Shan,Shaogang Gong and Peter
W. McOwan.Robust facial expression
r e c o g n i t i o n u s i n g l o c a l b i n a r y
patterns[J].Image Processing, 2005.
[3] 张铮, 王艳平, 薛桂香. 数字图像处理
与机器视觉[M]. 北京: 人民邮电出版
社,2010:406-408.
[4] 边肇祺, 张学工. 模式识别[M]. 北京:
清华大学出版社,2000.
[ 5 ] X F e n g , M P i e t i k a i n e n , A H a d i d .
Facial expression recognition with
local binary patterns and linear
programming[J].Pattern Recognition
And Image Analysis,2005.
作者单位
天津师范大学 天津市 300387