动作识别中局部时空特征的运动表示方法研究

ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇ

ａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用

２０１０。４６（３４）

７

动作识别巾局部时空特征的运动表示方法研究

雷

ＬＥＩ

庆１，２，３李绍滋ｈ２Ｑｉｎ９１．２．３

ＬＩ

Ｓｈａｏ—ｚｉｌ・２

１．厦门大学智能科学与技术系．福建厦门３６１００５

２．厦门大学福建省仿脑智能系统重点实验室，福建厦门３６１００５

３华侨大学计算机科学与技术学院．福建厦门３６１０２１

１．ＤｅｐａｒｔｍｅｎｔｏｆＣｃｇｘｆｉｆｉｖｅ

Ｓｃｉｅｎｃｅ，Ｘｉａｍｅｎ

Ｕｎｉｖｅｒｓｉｔｙ，Ｘｉａｍｅｎ，Ｆｕｊｉａｎ

３６１００５，Ｃｈｉｎａ

２．Ｆｕｊｉａｎ

３．Ｃｏｌｌｅｇｅ

ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＣｏｍｐｕｔｅｒ

ｏｆｔｈｅＢｒａｉｎ—ｌｉｋｅＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，ＸｉａｍｅｎＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｈｕａｑｉａｏ

Ｕｎｉｖｅｒｓｉｔｙ，Ｘｉａｍｅｎ，Ｆｕｊｉａｎ

３６１０２１，Ｃｈｉｎａ

３６１００５，Ｃｈｉｎａ

Ｕｎｉｖｅｒｓｉｔｙ，Ｘｉａｍｅｎ，Ｆｕｊｉａｎ

Ｅ－ｍａｉｌ：Ｒａｃｈｅｌ

ｌｅｉ＠ｓｉｎａ．ｃｏｍ

ｌｏｃａｌｓｐａｔｉｏ－ｔｅｍｐｏｒａｌｆｅａｔｕｒｅｓ

ｆｏｒａｃｔｉｏｎ

ｒｅｃｏｇｎｉｔｉｏｎ．ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｐｐＨ－

ＬＥＩ

Ｑｉｎｇ。ＬＩＳｈａｏ－ｚｉ．Ｒｅｓｅａｒｃｈ

Ｏｉｌ

ｃａｔｉｏｎｓ。２０１０。４６（３４）：７．１０．

Ａｂｓｔｒａｃｔ：Ｌｏｃａｌｓｐａｔｉｏ－ｔｅｍｐｏｒａｌ

ｆｅａｔｕｒｅｓｈａｖｅｂｅｃｏｍｅ

ａ

ｐｏｐｕｌａｒｖｉｄｅｏｒｅｐｒｅｓｅｎｔａｔｉｏｎ

ｆｏｒａｃｔｉｏｎ

ｒｅｃｏｇｎｉｔｉｏｎ

ｉｎｒｅｃｅｎｔ

ｙｅａｒｓ．

Ｓｅｖｅｒａｌｍｅｔｈｏｄｓｆｏｒｆｅａｔｕｒｅｄｅｔｅｃｔｉｏｎ

ａｒｅ

ａｎｄ

ｄｅｓｃｒｉｐｔｉｏｎｈａｖｅ

ｂｅｅｎ

ｐｒｏｐｏｓｅｄ

ｉｎ

ｔｈｅｌｉｔｅｒａｔｕｒｅ

ａｎｄ

ｐｒｏｍｉｓｉｎｇｒｅｃｏｇｎｉｔｉｏｎｒｅｓｕｌｔｓ

ｏｎ

ｄｅｍｏｎｓｔｒａｔｅｄｆｏｒａ

ｎｕｍｂｅｒｏｆａｃｔｉｏｎｃｌａｓｓｅｓ．Ｔｈｉｓｐａｐｅｒｅｍｐｌｏｙｓｔｈｅｍｏｔｉｏｎ

ａｃｔｉｏｎ

ｒｅｐｒｅｓｅｎｔａｔｉｏｎｂａｓｅｄ

ａｎｄ

ｓｐａｃｅ－ｔｉｍｅ

ｉｎｔｅｒｅｓｔｉｎｔｅｒｅｓｔｓ

ｐｏｉｎｔｓ

ａｎｄ

ｉｍｐｌｅｍｅｎｔｓ

ｆｒｏｍ

ｒｅｃｏｇｎｉｔｉｏｎ

ｍｅｔｈｏｄｂａｓｅｄ

ｏｎ

ｓｐａｔｉｏ—ｔｅｍｐｏｒａｌ

ｅｏｄｅｂｏｏｋ

ｗｏｒｄｓ．Ｆｉｒｓｔｌｙ，ａｃｃｕｒａｔｅ

ｐｏｉｎｔｓｄｅｔｅｃｔｅｓｇｒａｍ

ｖｉｄｅｏｓ

ｔａｋｉｎｇｏｆｆｌｏｗ

ａｄｖａｎｔａｇｅｏｆＧａｂｏｒａｎｄＧａｕｓｓｉａｎｍｉｘｔｕｒｅｆｉｌｔｅｒｉｎｇ，ｔｈｅｎｔｈｒｅｅｋｉｎｄｓｏｆｌｏｃａｌｆｅａｔｕｒｅｓ：ｈｉｓｔｏ－

ａｎｄｈｉｓｔｏｇｒａｍ

ｏｎ

ｏｆｇｒａｄｉｅｎｔ，ｈｉｓｔｏｇｒａｍ

ｃｌｕｓｔｅｒ

ａｌｇｏｒｉｔｈｍ

ｏｆｓｐａｃｅ－ｔｉｍｅａｎｄ

ｇｒａｄｉｅｎｔ

ａｒｅｅｘｔｒａｃｔｅｄ

ａｓ

３ＤＳＩＦＴｔｏａ

ｄｅｓｃｒｉｂｅｓｔａｎｄａｒｄ

ｉｎｔｅｒｅｓｔｐｏｉｎｔｓ．ｂａｇ—ｏｆ－ｆｅａｔｕｒｅｓ

ｏｖｅｒ

Ｋ－ｍｅａｎｓ

ｐｅｒｆｏｒｍｓ

ｆｅａｔｕｒｅｓｌｅａｒｎｓｔｈｅ

ｓｐａｔｉａｌ－ｔｅｍｐｏａｌｃｏｄｅｂｏｏｋ．Ｆｉｎａｌｌｙ

ｉｎｖｅｓｔｉｇａｔｅｄ

ｔｈａｔ

ｏｎ

ａ

ＳＶＭａｐｐｒｏａｃｈｉｓｕｓｅｄｆｏｒａｃｔｉｏｎ

ｔｗｏ

ｒｅｃｏｇｎｉｔｉｏｎ．Ｔｈｅ

ｐｅｒｆｏｒｍａｎｃｅｉｓ

ｔｏｔａｌｏｆ１６ａｃｔｉｏｎｃｌａｓｓｅｓｄｉｓｔｒｉｂｕｔｅｄｓｐａｔｉａｌ

ｗｉｔｈ

ｔｅｍｐｏｒａｌ

ｄａｔａｓｅｔｓ

ｗｅｌｌ

ｗｉｔｈ

ｖａｒｙｉｎｇ

ｔｏ

ｄｉｆｆｉｃｕｌｔｙ．Ｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｄｅｎｌｏｎｓ乜．ａｔｅ

ｆｅａｔｕｒｅｓｃｏｍｂｉｎｅｄｉｎｆｏｒｍａｔｉｏｎｉｎｒｅａｌｉｓｔｉｃ

Ｃａｎ

ａｄａｐｔｅｄ

ｃｏｍｐｌｅｘ

ｅｎｖｉｒｏｎｍｅｎｔ

ｓｕｃｈａｓｃａｍｅｒａ

ｍｏｖｅｍｅｎｔ，ｉｌｌｕｍｉｎａｔｉｏｎ

ｃｈａｎｇｅｓａｎｄｄｉｆｆｅｒｅｎｔｃｌｏｔｈｉｎｇ

ｓｅｔｔｉｎｇｓ

ａｎｄａｃｈｉｅｖｅｂｅｔｔｅｒｒｅｃｏｇｎｉｔｉｏｎｐｅｒｆｏｒｍａｎｃｅ．

Ｋｅｙｗｏｒｄｓ：ｓｐａｔｉｏ－ｔｅｍｐｏｒａｌ

ｆｅａｔｕｒｅ；ｓｐａｃｅ—ｔｉｍｅｉｎｔｅｒｅｓｔｐｏｉｎｔ；ｍｏｔｉｏｎｒｅｐｒｅｓｅｎｔａｔｉｏｎ；ａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎ

摘要：近年来，基于局部时空特征的运动表征方法已被越来越多地运用于视频中的动作识别问题，相关研究人员已经提出了多种特征检测和描述方法，并取得了良好的效果。但上述方法在适应摄像头移动、光照以及穿着变化等方面还存在明显不足。为此，提出了基于时空兴趣点局部时空特征的运动表示方法，实现了基于时空单词的动作识别。首先采用基于Ｇａｂｏｒ滤波器和Ｇａｕｓｓｉａｎ滤波器相结合的检测算法从视频中提取时空兴趣点，然后抽取兴趣点的静态特征、运动特征和时空特征。并分别对运动进行表征，最后利用基于时空码本的动作分类器对动作进行分类识别。在Ｗｅｉｚｍａｒｍ和ＫＴＨ两个行为数据集进行了测试，实验结果表明：基于时空特征的运动表示能够更好地适应摄像头移动、光照变化以及施动者的穿着和动作差异等环境因素的影响，取得更好的识别效果。

关键词：时空特征；时空兴趣点；运动表征；动作识别ＤＯＩ：１０．３７７８／ｊ．ｉｓｓｎ．１００２．８３３１．２０１０．３４．００３

文章编号：１００２．８３３１（２０１０）３４．０００７．０４

文献标识码：Ａ

中图分类譬：ＴＰ３９１．４

１

引言

动作识别和行为理解是计算机视觉和模式识别领域中一

识别和高层行为理解等内容，在身份识别、视频检索、智能安

防、人机接口等领域有着广泛的应用前景”１。

动作识别和行为理解的主要任务是利用计算机技术对包

个重要的研究课题，它包含运动检测、目标分类和跟踪、动作

基金项目：国家自然科学基金（ｔｈｅＮａｔｉｏｎａ｜ＮａｍｍｌＳｃｉｅｎｃｅＦｏｕｎｄａｔｉｏｎｏｆＣｈｉｎａｕｎｄｅｒＣｎ＇ａｎｔＮｏ．６０８７３１７９）；高等院校博士学科点专项科研基

金（ｔｈｅＣｈｉｎａＳｐｅｃｉａｌｉｚｅｄＲｅｓｅａｒｃｈＦｕｎｄｆｏｒ山ｅＤｏｃｔｏｒａｌＰｒｏｇｒａｍｏｆＨｉｇｈｅｒＥｄｕｃａｄｏｎｕｎｄｅｒＧｒａｎｔＮｏ．２００９０１２１１１００３２）；深圳市科技计划项目．基础研究（Ｎｏ．ＪＣ２００９０３１８０６３０Ａ）；深圳市科技研发基金项目．深港创新圈计ＪＯＪ（Ｎｏ．ＺＹＢ２００９０７１１０１６９Ａ）。

作者筒介：雷庆（１９８０．），女，博士研究生，主要研究领域为智能多媒体信息处理；李绍滋（１９６３．），男。博士。教授，博士生导师，主要研究领域为智

能多媒体信息处理、人工智能及其应用、机器学习与计算等。

收稿日期：２０１０．０８．０９修回日期：２０１０．１０．２５

万方数据

８

ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用

含人的图像序列进行分析，识别出人的动作，然后通过连续的

跟踪并结合上下文环境对其行为进行推理和描述。一般包含两个层次的任务：一是底层的运动检测、目标分类和跟踪，需要从目标的运动信息中提取特征信息对运动进行表征；二是高层的行为建模和识别，包含对原子动作的识别，以及结合场景信息和领域知识，实现对行为的深层次理解。

目前底层处理方面的研究取得了较大进展，而高层处理的研究还处于起步阶段，由于底层处理受到视角变换、光照变

化、遮挡、复杂背景等环境闵素的影响，从而给高层行为理解

带来很大的硝难。因此，如何从视频中提取能够适应于环境变化的特征，以及如何对特征进行描述才能够有效地对动作

进行表征成为动作识别的关键问题。

近年来，研究者提出了基于时空兴趣点的动作表示和识别方法，该方法首先从图像序列中检测出能够代表视频中发生的时空事件的兴趣点，然后抽取时空兴趣点的各种特征对动作进行表征，最后建立动作分类器进行动作识别。Ｌａｐｔｅｖｔ驯

将二维图像中的Ｈａｒｒｉｓ角点检测技术扩展到ｉ维时空领域

中，从视频中检测出丰富的代表时空事件的兴趣点，建立以兴趣点为中心的时空立方体并抽取光流直方图和梯度直方图的

联合特征ＨＯＧ／Ｉ－ＩＯＦ对运动进行表征，最后建立基于ＳＶＭ的

动作分类器对动作进行分类。Ｄｏｌｌａｒ。５１提出了基于Ｇａｂｏｒ滤波器的时空兴趣点检测算法，并提出了基于Ｃｕｂｏｉｄｓ的特征描述算子，采用ＰＣＡ算法对特征进行降维，最后采用基于ｘ２距离的

最近邻分类器进行动作识别。Ｓｕｎ等人”１提出了一种对时空

上下文信息进行层次建模的方法，首先采用ＳＩＦＴ算法对视频

进行兴趣点检测并进一步抽取出兴趣点的运动轨迹，然后抽取了兴趣点运动轨迹的三个层次的时空上下文信息，最后建

立了基于ＭＫＬ的多核学习非线性ＳＶＭ分类器对特征进行分类。

已有的特征检测和描述方法在简单动作的识别问题中取得了良好的效果，但由于实验环境和条件的差异，难以对这些已有方法进行比较。本文的目的是在一个统一的实验环境中对目前动作识别中常用的特征检测和描述方法进行比较．对

它们的性能进行整体评估。采用了基于时空兴趣点和时空单

词的动作表示和识别方法，首先实现了Ｇａｂｏｒ和Ｇａｕｓｓｉａｎ滤波器相混合的时空兴趣点检测算法。该算法能够快速准确地从

视频中提取出丰富的兴趣点，然后抽取了兴趣点的灰度梯度、光流、时空梯度三种统计信息分别对运动进行表征．最后建立

了基于兴趣点特征的时空码本并构造出动作分类器。仿真实

验结果表明：抽取兴趣点的时空特征对动作进行表征，能够更

好地适应摄像头移动、光照变化以及施动者的穿着和动作差异等环境因素的影响。

２基于局部时窄特征的动作识别模哩

２．１

动作识别的基本思想

实现了基于时空兴趣点和时空单词的动作表示和识别方

法，该方法首先通过训练从样本中提取出准确的时空兴趣点，建立基于兴趣点特征的时空码本，并构造出动作分类器。在动作识别过程中，计算待分类视频中的兴趣点特征和时空码

本的距离对兴趣点进行分类，生成对视频动作进行表征的时

空单词，最后通过动作分类器进行分类识别。

２．２

基ｆ硒部时审特征表征的动作识别模型

系统框架如图１所示。

万方数据

集

孤／Ｌ型小杉赢溢、胚

测试视频

圳ｂ撰态

Ｉ样本兴趣Ｉ

Ｉ皇叁垒Ｉ阿ｉ藉磊习（样妻篓他

兴趣点分垂≥—・＿一时窄码本

动作分类器

…Ｊ’、、—、．——．—．—一

类别统汁直方图卜卜—Ｌ类别统计

图ｌ系统框架图

３局部时窄特征的检测和描述３．１时窄兴趣点检测

经观察发现，时空事件往往发生在视频数据在空间和时间两个维度卜．都剧烈变化的地方。因此，如何从视频中准确地抽取代表时空事件的兴趣点成为动作表征的首要关键问题。采用Ｄｏｌｌａｒ提出的基于Ｇａｂｏｒ滤波器和Ｇａｕｓｓｉａｎ滤波器相结合的时空兴趣点检测方法，首先使用高斯滤波器在空间域上对图像进行滤波，然后使用一维的Ｇａｂｏｒ滤波器在时间域上作用对图像序列，定义响应函数：

Ｒ＝（Ｐｇ＋ｈ。）２＋（Ｐｇ＋ｈ耐）２

（１）

用于测定图像序列中每个位置的强度值。其中ｇ（ｘ，ｙ；盯）

是空间域上的二维高斯平滑核，ｇ（ｘ，ｙ；ｔｒ２）＝＾ｅ吖吖‘肪‘；

Ｚ７【盯一

ｈ。和ｈ耐是作用于时间域的一对正交的一维Ｇａｂｏｒ滤波器，＾。（ｆ；ｒ，叻＝一ｃｏｓ（２ｎｔｏＪ）ｅ－”∥，ｈｏｄ（ｆ；ｆ，妫＝一ｓｉｎ（２ｘｔｔｏ）ｅ。‘７。，∞＝４／ｒ。其中，盯和ｒ分别表示响应函数在空问和时间域上的检测尺度。

实验中选取参数矿＝２，ｒ＝２．５，滤波窗１２１大小设为３的条件下进行兴趣点检测，结果如图２和３所示。

幽２

Ｗｅｌｚｍａｍａ数据粜ｗａｖｉｎｇ动作必趣点检测结粜

图３

ＫＴＨ数据集ｒｕｎｎｉｎｇ动作兴趣点检澍结果

雷庆，李绍滋：动作识别中局部时空特征的运动表示方法研究２０１０。４６（３４）９

３．２兴趣点特征描述

目前动作识别中所采用的特征描述方式主要包括：基于边缘或形状的静态特征、基于光流或运动轨迹的动态特征，以及基于时空体积数据的时空特征。静态特征容易获得且比较稳定，对纹理变化不敏感，但其准确性受到跟踪和姿态估计精度的影响，对环境的动态变化敏感。动态特征直接从图像序

列的相邻帧中提取，运动信息的计算过程可能遇到孔径等问

题的影响且缺乏对行为的令局分析。时空特征方法把图像序列看作时空相关的＝三维体积数据．通过提取静态模式获得动作的时空表示，它不仅包含人动作姿态的空间信息，而且还包含了运动信息，集合了形状和运动特征两者的优点。

在准确提取兴趣点的基础上，抽取了兴趣点的灰度梯度、光流、时空梯度三种统计信息分别对运动进行表征，并对它们的性能进行了对比。

３．２．１

梯度直方网ＨｏＧ

ＨＯＧ是类似于ＳＩＦＴ特征的一种局部静态描述符．它通过

计算局部区域上的梯度方向直方图来构成特征。ＨＯＧ是在被称为Ｃｅｌｌ和Ｂｌｏｃｋ的网格内进行密集计算得到，Ｃｅｌｌ（图像单元）由若干像素点构成，而Ｂｌｏｃｋ（图像块）则由若干相邻的Ｃｅｌｌ组成。

ＨＯＧ的具体计算过程如下：

（１）将规范化大小的检测窗口作为输入，通过梯度算子计算水平和垂直方向上的梯度．例如ｆ＿１，０，１】。

（２）以各像素点的梯度幅值或梯度幅值的函数为权重，采

用３线性插值进行投票的方法统计各Ｃｅｌｌ的梯度方向加权直方图，得到Ｃｅｌｌ的图像单元直方图（ＣｅｌｌＨＯＧｓ）。

（３）对同一Ｂｌｏｃｋ内的ＣｅｌｌＨＯＧｓ进行归一化处理，以消除光照的影响，得到Ｂｌｏｃｋ的图像块梯度直方图（ＢｌｏｃｋＨＯＧｓ）。

（４）将待检测窗口的所有Ｂｌｏｃｋ＿ＨＯＧｓ串在一起构成特征向量。

Ｎａｖｎｅｅｔ

Ｄａｌａｉ在２００５年提出的文章中使用ＨＯＧ特征训

练分类器，在行人检测中得到很好的检测结果。近年来，研究者也将ＨＯＧ特征描述方法引入到动作识别问题中，在简单动作的识别Ｉ、ｕＪ题上取得了一定的效果。３．２．２光流直方图ＨＯＦ

动态特征描述方法直接提取视频中的运动信息对运动进

行表征．最具代表的是光流法。在假设相邻两幅图像中对应

两点的灰度不变而且光照均匀的前提下，计算空间运动物体表面上像素点运动产生的瞬时速度场来表征运动状态。Ｚｈｕ等人”１提出了用光流直方图来描述动作的运动信息，然后用支持向量机做分类器识别运动员的击球动作。

Ｌａｐｔｅｖ和Ｌｉｎｄｅｂｅｒｇ提出了空间梯度直方图和光流直方图相联合的局部特征描述方法（ＨＯＧ／ＨＯＦ），梯度的计算只局限在图像二维空间域上，时间域上的信息通过光流直方图的统计引入进来。抽取以兴趣点为中心的图像立方体数据，将立方体数据划分为统一大小的单元，对每个单元计算４ｂｉｎ的梯度直方图以及５ｂｉｎ的光流直方图，归一化后联合形成ＨＯＧ／ＨＯＦ特征描述子，最后将所有单元的ＨＯＧ／ＨＯＦ特征串联起来生成该兴趣点最终的特征描述。３．２．３三维时空梯度３Ｄ

ＳＩＦＴ

时空特征是近年来动作识别研究中使用较多的特征，它基于二维图像在一段时间内形成的时空立方体，不仅包含了

万方数据

人动作姿态的空间信息，还包含了运动的动态信息，集合了形

状和运动特征两者的优点，避免了光流场计算可能遇到的孔

径、全局平滑性约束，以及由于遮挡等因素造成的外观形状跟踪失败等问题。

３Ｄ

ＳＩＦＴ特征描述子是由Ｓｃｏｖａｌｌｎｅｒ等人”１提出的一种三

维时空梯度方向直方图，可以看作是经典的尺度不变特征变换描述算子（２ＤＳＩＦＴ）从静态图像到视频序列的扩展。由于

能够更好地适应缩放、旋转、仿射变换以及噪声带来的影响，

采用３ＤＳＩＦＴ的特征描述方式能够准确地捕捉到视频数据的时空特性本质。以下给出时空兴趣点的３ＤＳＩＦＴ特征描述子的定义。

首先，三维空间中的点（工，Ｙ，ｆ）的梯度矢量由其梯度幅值ｍ。两个方向的梯度角度甜ｎ妒组成，分别定义如下：

ｍ３Ｄ（工，Ｙ，ｆ）＝、ｆ￡：＋Ｌ；＋三；

（２）

￡

‘０（ｘ，Ｙ，ｆ）＝ａｒｃｔａｎ（－ＴＬ）

（３）

烈工，Ｙ，ｆ）＝ａｒｅｔａｎ（１告），妒∈（一詈，＋詈）

厶ｊ

，

（４）

√工：＋三；

‘

其中，厶，Ｌ，厶可以分别在ｚ，Ｙ，ｆ方向上进行差值运算得到，

例如：

Ｌ：Ｌ（ｘ＋Ｉ，Ｙ，ｆ）也（弘ｌ，Ｙ，ｆ），ｔ：－ｔ．（ｘ，ｙ＋ｌ，ｔ）－Ｌ（ｘ，弘ｌ，ｆ）以及ＬｍＬ（ｘ，Ｙ，ｔ＋１）－Ｌ（ｘ，Ｙ，ｔ－１）。

然后定义时空兴趣点的３ＤＳＩＦＴ描述符：从视频中抽取以兴趣点为中心的时空立方体，将立方体划分为固定大小的

单元立方体，统计每个单元立方体的时空梯度直方图，最后将所有单元立方体的直方图联合起来构成该兴趣点最终的３Ｄ

ＳＩＦＴ描述符。例如，按照２×２ｘ２对立方体进行划分，分成８个４ｘ４ｘ４的单元立方体，如图４所示。

图４

３Ｄ

ＳＩＦＴ特征描述符

按照如下方法计算单元立方体的梯度直方图：由于立方体中像素点的梯度矢量（耽。，目，妒）由三个分量构成，其中梯度方向包含了目和妒两个角度，将目和ｐ值按照等大小（例如４５０）

划分为若干个值区间ｂｉｎｓ，将梯度矢量按照其幅值和在立体球面上的面积加权投票到兴趣点的二维梯度方向直方图

ｈｉｓｔ（ｉ，，ｆ．）中。ｈｉｓｔ（ｉｏ，厶）的计算公式如下：

－－Ｒｘ～蚪＋ｂ一婚＋ｑ．ｔＡ

１

．。２一一

ｈｉｓｔ（ｉ日，Ｕ＋＝÷朋３Ｄ０，Ｙ，ｆ）ｅ

”

（５）

其中，∞表示立体球面按照水平和垂直两个方向划分后每个二维ｂｉｎ所占的面积，由于球面上每个ｂｉｎ所占的面积大小不同。

１０

２０１０，４６（３４）

ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用

越靠近两极ｂｉｎ所占面积越小，因此还必须按照对面积进行归一化，其计算公式为：

∞＝ｆ＋却ｒ＋们ｓｉＩｌａｄ铷＝△妒ｆ＋醐ｓｉｎ锄目：

Ａ妒［－ｃｏｓ程～＝姒ｃｏｓＯ－－ＣＯＳ（０＋ａｔ０）

（６）

４动作分类器４．１时宅码本的建屯

由于动作实施者在穿着、动作方式和幅度上存在差异，因此同样的动作在不同视频中产生的兴趣点不尽相同，但这些

兴趣点的特征存在着相似性，提供了对动作的时空本质特征

的描述：因此从兴趣点的特征集合中识别出能够代表相同动作的特征模式，将有助于后续的动作分类。

训练过程中，引入文本分类中ｂａｇ．ｏｆ－ｆｅａｔｕｒｅｓ的思想，采用Ｋ－ｍｅａｎｓ聚类算法对训练数据集中提取出的特征集合进行聚类。聚类中心的个数在实验中进行选取。将生成的聚类中心看作时空单词ｗ尸｛，：０，…彳｝，ｍ为特征维数０表示时空单词

的第ｆ个特征分量。所有时空单词组成的集合肛｛ｗ，，Ｗ２，…，

Ｍ｝称为时空码本，其中疗为聚类中心的个数。对于不同的动作视频，从训练集中按照上述的步骤训练出对应于不同动作类别的时空码本，在后续的动作识别过程中通过计算兴趣点的特征与时空单测的距离实现对兴趣点进行分类，并进一步完成动作分类。

４．２动作分类器设计

对于一个包含人体动作的视频，从中提取了兴趣点，得到

兴趣点集尸ｔ慨，Ｐ：，…，历）。对于每个兴趣点Ｐ，，计算其时空特

征只＝讲，Ｚ，…，‘｝。根据训练集特征集合中聚类得到的时空

码本降｛ｗ。，Ｗ２，…，Ｍ｝，计算特征Ｆ与时空码本中每个时空单

词忻圻０，…Ｚ｝的欧式距离或ｆ距离，选取最小距离完成对

兴趣点的分类。

对视频中所有兴趣点的类别进行统计，得到基于时空码

本的兴趣点类别统计直方图胙｛厅，，ｈ：，…，ｈ。｝，＂等于时空码

本维数，其中ｈ。表示视频中第ｆ个时空单词出现的频率（ｉ＝１，

２，…，万）。最后采用ｆ核的非线性支持向量机ＳＶＭ进行分类，

核函数计算公式如下所示：

础删＝ｅｘｐ（－击蠢等等）

（７）

其中，肛帆。，ｈ。，…，ｋ｝和Ｈ尸｛ｈｊ。，‰，…，ｋ｝表示时空单词出

现频率直方图，以为时空码本维数，Ａ表示所有训练样本之问

的平均距离。

５实验及结果分析５．１动作数据集

对两个行为数据集Ｗｅｉｚｍａｎｎ

ａｃｔｉｏｎ

ｄａｔａｓｅｔ‘９Ｉ和ＫＴＨ

ａｃ—

ｔｉｏｎｓ

ｄａｔａｓｅｔ＂ｏｌ和包含的１６种不同动作类别进行了分类效果的测试。Ｗｅｉｚｍａｎｎ数据集包含了ｂｅｎｄ、ｊａｃｋ（原地跳步）、ｊｕｍｐ（跳

步前行）、ｐｊｕｍｐ（原地纵跳）、ｒｕｎ、ｓｉｄｅ（横向步行）、ｓｋｉｐ（单腿跳

行）、ｗａｌｋ、ｗａｖｅｌ（单手挥舞）和ｗａｖｅ２（双手挥舞）共ｌＯ种动作，由９个表演者在单一静态背景下完成的９３个动作视频。

ＫＴＨ数据集中包含了６种动作：ｗａｌｋｉｎｇ、ｊｏｇｇｉｎｇ、ＦＵｌｌ—

ｎｉｎｇ、ｂｏｘｉｎｇ、ｈａｎｄｗａｖｉｎｇ和ｈａｎｄｃｌａｐｐｉｎｇ，由２５个ａｃｔｏｒｓ在４种

万方数据

不同的场景（ｏｕｔｄｏｏｒｓ、ｏｕｔｄｏｏｒｓ

ｗｉｔｈｓｃａｌｅｖａｒｉａｔｉｏｎ、ｏｕｔ－

ｄｏｏｒｓｗｉｔｈ

ｄｉｆｆｅｒｅｎｔ

ｃｌｏｔｈｅｓ和ｉｎｄｏｏｍ）中完成，共计６００个视

频。视频空间分辨率为１６０×１２０，帧速率为２５∥ｓ，平均视频长度大约４秒钟。

５．２实验结果及分析

对不同的数据集分别进行训练，从中选取每个动作的６个视频作为训练样本，训练过程中，以矿＝２，ｒ＝２．５为尺度进行兴趣点检测，从视频中抽取出兴趣点，然后采用ＨＯＧ（空问梯度直方图）、ＨＯＦ（光流直方图）、ＨＯＧ／ＨＯＦ（空间梯度／光流直方图联合）和３ＤＳＩＦＴ（时空梯度直方图）４种特征描述方式建立兴趣点样本特征集合，采用ｋ－ｍｅａｎｓ聚类算法对样本特征集合进行聚类建立了样本空问的时空码本，由于ｋ－ｍｅａｎｓ聚类算法的初始类别随机产生，且聚类维数的选取对识别性能都产生影响，经过实验观察选取维数为５０。

表ｌ和表２分别给出了３ＤＳＩＦＴ特征在两个数据集上的识别效果，表３给出了空问梯度直方图、光流直方图、梯度／光流直方图联合、时空梯度直方图４种特征在两个数据集上的平均分类准确率。

表１

Ｗｅｉｚｍａｎｎ数据集Ｉ：讽别致果的混淆矩阵

ｂｅｎｄ

ｊｕｍｐｐｊｕｍｐ

ｒｕｎｗａｌｋｗａｖｅｌｗａｖｅ２

表２

ＫＴＨ数据集卜识ｇｑ效果的混淆矩阵

ｗａｌｋｉｎｇ

ｊｏｇｇｉｎｇ

ｒｕｎｎｉｎｇｂｏｘｉｎｇｈａｎｄｗａｖｍｇｈａｎｄｃｌａｐｐｉｎｇｗａｌｋｉｎｇ

０．８３０．１２０．０５０００ｊｏｇｇｉｎｇ

０．１６０．５９０．２５０００ｒｕｎｎｉｎｇＯ．１３Ｏ．２００．６７０００ｂｏｘｉｎｇ０００Ｉ．００００ｈａｎｄｗａｖｉｎｇ００００Ｉ．０００ｈａｎｄｃｌａｐｐｉｎｇ

０

Ｏ．２０

Ｏ．８０

表３空间梯度育方嘲．光流直方图，梯度／光漉联合、时窄梯度直，『煳特征在Ｗｅｉｚｍａｒｍ和

ＫＴＨ数据集卜的乎均分类准确率

（％）

实验结果表明抽取兴趣点的时空特征对动作进行表征，

能够更好地适应摄像头移动、光照变化以及施动者的穿着和动作差异等环境因素的影响，取得更好地识别效果（８４．１％

Ｏｎ

Ｗｅｉｚｍａｎｎ，８１．５％ＯｉｌＫＴＨ）。在单一且无动态变化的背

景下，光流直方图特征的识别准确率（８２．３％）要高于空间梯度

直方图（７６．８％）以及联合特征（７８．２％）。而在摄像机移动、光

照变化等｝ｌ：ｌ素的干扰下，光流的计算效果受到影响（７７．２％），而联合特征的引入（７７．８％）将使识别效果得到一定的改善。

６总结

实现了基于时空兴趣点和时空码本的动作表示和识别方

（下转１４页）

１４

２０１０，４６（３４）

ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇ

ａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用

（２ＪＴａｎｇＪＬ，ＣｈｅｎＷＳ，ＷａｎｇＪ．ＡｎｏｖｅｌｌｉｎｅａｒａｌｇｏｒｉｔｈｍｆｏｒＰ５Ｐ

ｐｒｏｂｌｅｍ［Ｊ］．Ａｐｐｌｉｅｄ

６２８—６３４．

Ｍａｔｈｅｍａｔｉｃｓ

ａｎｄ

Ｃｏｍｐｕｔａｔｉｏｎ，２００８，２０５：

看出，免疫位姿检测算法，平均计算时间为８．０５３４×１０－２ｓ，小

于基于Ｇｕａｓｓ－Ｎｅｗｔｏｎ迭代算法的位姿检测算法的平均计算时间８．３１３

８×１０。２

ｓ。因此，在具有相似的精确度的条件下，本

文算法的运算时间更短，收敛更快。

相较于传统迭代算法，免疫进化算法在运算速度和收敛性方面具有一定的优越性，原因是：（１）基于高斯牛顿方法的迭代位姿估计需要提供较好的迭代初值，当初值不合理，算法

ｆ３】Ｑｉｎ

Ｌ

Ｊ．ＺｈｕＦＡｎｅｗｍｅｔｈｏｄ

ｆｏｒｐｏｓｅ

ｅｓｔｉｍａｔｉｏｎｆｒｏｍ

ｌｉｎｅ

ｃｏｒｒｅｓｐｏｎｄｅｎｃｅｓ［Ｊ］．ＡｃｔａＡｕｔｏｍａｔｉｃＳｉｎｉｃａ，２００８，３４（２）：１３０—１３４．【４】Ｌｏｗｅ

Ｄ

Ｇ．Ｆｉｕｉｎｇｐａｒａｍｅｔｅｒｉｚｅｄ

ｔｈｒｅｅ－ｄｉｍｅｎｓｉｏｎａｌｍｏｄｅｌｓｔｏ

ｉｍａｇｅｓ［Ｊ］．ＩＥＥＥＴｒａｍＰａａｅｍＡｎａｌＭａｃｈｉｎｅｌｍｅｌｌ．１９９１。１３（５）：

４４ｌ－４５０．

会收敛慢，甚至不收敛；此外它每次迭代过程都需要对一个

ＮｘＮ的矩阵进行逆计算（Ⅳ为几何模型的约束条件），当提取

【５】ＨａｒａｌｉｅｋＲＭ，ＪｏｏＨ，ＬｅｅＣ，ｅｔａ１．Ｐｏｓｅｅｓｔｉｍａｔｉｏｎｆｒｏｍ

ｓｐｏｎｄｉｎｇ

ｐｏｉｎｔ

ｅｏｒｒｅ－

ｄａｔａ［Ｊ］．ＩＥＥＥＴｒａｎｓＳｙｓｔｅｍｓ，Ｍａｎ，ａｎｄＣｙｂｅｒｎｅｔ－

特征越多，约束条件越多，ＮｘＮ求逆的运算越复杂，这限制

了基于高斯牛顿方法的迭代位姿估计的计算快速性。（２）而免疫进化算法则由克隆、高频变异和抗体的促进与抑制机制等

ｉｅｓ．１９８９．１９（６）：１４２６．１４４６．

【６】ＮｉｓｔｄｒＤ，Ｓｔｅｗ６ｎｉｕｓＨ．Ａｍｉｎｉｍａｌｓｏｌｕｔｉｏｎ

３－ｐｏｉｎｔ

ｔｏｔｈｅ

ｇｅｎｅｒａｌｉｚｅｄ

ｐｏｓｅｐｒｏｂｌｅｍ［Ｊ］．ＭａｔｈＩｍａｇｉｎｇＶｉｓｉｏｎ。２００７．２７（１）：６７—７９．

Ｆ

ａ

使进化过程不断向最优解集移动，这加速了算法的收敛，同时免疫记忆的引入，不但能够为每次进化过程提供当前最优抗体，还能够保留进化中的优秀抗体，以应对相似抗原的出现。５总结

借鉴生物免疫系统中克隆选择和免疫记忆等机理，提出了一种基于免疫算法的并联机构位姿检测算法。它通过免疫进化来搜索并联结构的位姿可行解，避免了传统迭代算法中需要提供良好迭代初值和解析算法对噪声敏感的问题。实验结果表明，该算法能够快速收敛，并获得较精确结果，而且对

【７】ＤｕａｎＦＱ，Ｗｕ

ｓｕｒｅｎｌｅｎｔｕｓｉｎｇ（３）：２２３—２３１．［８】Ｙｕａｎ

ｆｏｒ

ａ

Ｃ，ＨｕＺＹ．Ｐｏｓｅｄｅｔｅｒｍｉｎａｔｉｏｎａｎｄｐｌａｎｅｍｅｎ－

ｔｒａｐｅｚｉｕｍ［Ｊ］．ＰａａｅｍＲｅｃｏｇｎｉｔ

Ｌｅｔｔ，２００８。２９

ＸＸ．Ａｎｏｖｅｌｍｅｔｈｏｄｏｆ

ｓｙｓｔｅｍａｔｉｃ

ｅｒｒｏｒ

ｃｏｍｐｅｎｓａｔｉｏｎ

Ｎａｔｕｒａｌ

ｐｏｓｉｔｉｏｎａｎｄｏｒｉｅｎｔａｔｉｏｎｓｙｓｔｅｍ［Ｊ］．Ｐｒｏｇｒｅｓｓｉｎ

Ｓｃｉ—

ｅｎｃｅ，２００８，１８：９５３．９６３．

１９】ＬｉｕＭＬ。ＷｏｎｇＫＨ．Ｐｏｓｅｅｓｔｉｍａｔｉｏｎｕｓｉｎｇｆｏｕｒｃｏｒｒｅｓｐｏｎｄｉｎｇ

ｐｏｉｎｔｓ［Ｊ］．ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎＬｅｔｔｅｒ，１９９９，２０：６９－７４．［１０】Ｈｏｕ

Ｃ

Ｈ．ＤｉｎｇＹＳ，Ｚｅｎｇｆｏｒ

ｆａｂｒｉｃ

Ｘ

Ｙ．１ｍｍｕｎｅｂａｓｅｄｅｖｏｌｕｔｉｏｎａｒｙａｌ—

ａｎｄ

Ｃｏｍｐｕｔｅｒｓ

ｇｏｆｉｔｂｍｉｎ

ｅｖａｌｕａｔｉｏｎ［Ｊ］．Ｍａｔｈｅｍａｔｉｃｓ

Ｓｉｍｕｌａｔｉｏｎ，２００８，７７（５／６）：５４０．５４９．

Ｙ

特征提取不敏感，具有较好的鲁棒性。参考文献：

【１】ＧａｏＸＳ，ＴａｎｇＪ．Ｏｎｔｈｅｐｒｏｂａｂｉｌｉｔｙｏｆｔｈｅｎｕｍｂｅｒ

ｔｉｏｎｓｆｏｒｔｈｅＰ４Ｐ７９－８６．

ｏｆｓｏｌｕ－

【１１】Ｄｉｎｇ

ｅｓ

Ｓ，ＸｕＹ

Ｃ．Ｉｎｔｅｌｌｉｇｅｎｔｏｐｔｉｍａｌｓｅｌｅｃｔｉｏｎｏｆｇａｒｍｅｎｔｓｉｚ—

ｂｙ

ｕｓｉｎｇｉｍｍｕｎｅａｌｇｏｒｉｔｈｍａｎｄＡＨＰｍｅｔｈｏｄ［ＪＪ．Ｊｏｕｒｎａｌｏｆ

ｔｈｅＴｅｘｔｉｌｅ

Ｉｎｓｔｉｔｕｔｅ。２００８．９９（３）：２８１．２８６．

ｎｏｖｅｌｈｙｂｒｉｄｄｅｓｉｇｎ

ａｎｄ

【１２】Ｒｔｚａ

Ｙｄ＆ｚＡ．Ａ

ｉｎ

ｉｍｍｕｎｅａｌｇｏｒｉｔｈｍｆｏｒｇｌｏｂａｌｍａｎｕｆａｃｔｕｒｉｎｇ［Ｊ］．Ｒｏｂｏｔｉｃｓ

ａｎｄ

ｐｒｏｂｌｅｍ［Ｊ］．ＭａｔｈＩｍａｇｉｎｇＶｉｓｉｏｎ，２００６，２５（１）：

ｏｐｔｉｍｉｚａｔｉｏｎ

Ｃｏｍｐｕｔｅｒ－ＩｎｔｅｇｒａｔｅｄＭａｎｕｆａｃｔｕｒｉｎｇ，２００９，２５：２６１—２７０．

（上接１０页）

法。首先实现了Ｇａｂｏｒ滤波器和Ｇａｕｓｓｉａｎ滤波器相结合的兴趣点检测算法，从视频中提取了准确的时空兴趣点。然后比较了兴趣点的空间梯度直方图、光流直方图以及时空梯度直方图三种局部特征的动作识别效果，在ＫＴＨ和Ｗｅｉｚｍａｎｎ两个动作数据集上进行了实验，结果表明时空特征的运动表示

ｏｇｎｉｔｉｏｎ［Ｃ］／／ＦｉｒｓｔＩｎｔｅｍａｆｉ【ｏｎａｌ

ｆｏｒＶｉｓｕａｌ

Ｍｏｔｉｏｎ

Ｗｏｒｋｓｈｏｐ

ｏｎ

Ｓｐａｔｉａｌ

Ｃｏｈｅｒｅｎｃｅ

Ａｎａｌｙｓｉｓ．ＩＳ．１．】：Ｓｐｒｉｎｇｅｒ。２００４．

【５】ＤｏｌｌａｒＰ，ｇａｂａｕｄＶ，ＣｏｔｔｒｅｌｌＧ，ｅｔａ１．Ｂｅｈａｖｉｏｒｒｅｃｏｇｎｉｔｉｏｎｖｉａ

ｓｐａｒｓｅｓｐａｔｉｏ－ｔｅｍｐｏｍｌ

ｆｅａｔｕｒｅｓ［Ｃ］／／ＶＳ－ＰＥＴＳ，２００５．

ｃｏｎｔｅｘｔ

【６】ＳｕｎＪｕ，ＷｕＸｉａｏ．Ｈｉｅｒａｒｃｈｉｃａｌｓｐａｔｉｏ・ｔｅｍｐｏｒａｌ

ｆｏｒａｃｔｉｏｎ

ｍｏｄｅｌｉｎｇ

ｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／ＣＶＰＲ．２００９．

【７】ＺｈｕＧｕａｎｇ，ｙｕ。ＸｕＣｈａｎｇ－ｓｈｅｎｇ．Ａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎｉｎｂｒｏａｄｃａｓｔ

ｔｅｎｎｉｓ

方法能够更好地适应摄像头移动、光照变化以及施动者的穿

着和动作差异等环境因素的影响，在简单动作识别Ｉ’ｕｊ题中取得更好的识别效果。

ｖｉｄｅｏ［Ｃ］／／Ｐｒｏｅｏｆｔｈｅ

ｌ８ｔｈ

Ｉｍｅｍａｔｉｏｎａｌ

Ｃｏｎｆｅｒｅｎｃｅ

ｏｎ

ＰａａｅｍＲｅｃｏｇｎｉｔｉｏｎ，２００６．

【８】ＳｃｏｖａｎｎｅｒＰ，Ａｌｉ

ａｎｄ

ｌ５ｔｈ

Ｓ。Ｓｈａｈ

ｔｏ

Ｍ．Ａ３－ＤｉｍｅｎｓｉｏｎａｌＳＩＦＴ

ｄｅｓｃｒｉｐｔｏｒ

本文实验中选取的动作数据库的背景相对简单，下一步

将对真实场景下的动作识别问题进行研究，进一步对各种特征的优缺点进行比较，此外还将进一步研究复杂的、多人交互动作的识别方法ｌ’ｕＪ题。

ｉｔｓａｐｐｌｉｃａｔｉｏｎ

ａｃｔｉｏｎ

ｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／Ｐｒｏｃｏｅｄｉｎｇｓｏｆｔｈｅ

ｏｎ

ＩｎｔｅｍａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅＭｕｔｔｉｍｅｄｉａ．２００７．

【９】Ｂｌａｎｋ．Ｗｅｉｚｍａｎｎｄａｔａｓｅｔ［ＥＢ／ＯＬ］．ｈｔｔｐ：／／ｗｗｗ．ｗｉｓｄｏｍ．ｗｅｉｚｍａｎｎ．∞．

Ｗ－ｖｉｓｉｏｎ／Ｓｐａｃｅ

ＴｉｍｅＡｃｔｉｏｕｓ．ｈｔｍｌ＃Ｃｌａｓｓｉｆｉｃａｔｉｏｎｏ％２０Ｄａｔａｂａｓｅ．

【１０】Ｓｃｈｕｌｄｔ．ＫＴＨｄａｔａｓｅｔ［ＥＢ／ＯＬ］．ｈｔｔｐ：／／ｗｗｗ．ｎａｄａ．ｋｔｈ．ｓｅ／ｃｖａｐ／ａｃｔｉｏｎｓ／．

参考文献：

【１】ＴｕｒａｇａＥＭａｃｈｉｎｅｒｅｃｏｇｎｉｔｉｏｎｏｆｈｕｍａｎａｃｔｉｖｉｔｉｅｓ：Ａｓｕｒｖｅｙ［Ｊ］．

ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｇＹ，２００８．１８（１ｉ）．

ｏｎ

【ｌｌ】ＮｉｅｂｌｅｓＪ，ＷａｎｇＨ，Ｆｅｉ—ＦｅｉＬ．Ｕｎｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇ

ｏｆｈｕｍａｎ

ａｃｔｉｏｎｃａｔｅｇｏｒｉｅｓｕｓｉｎｇｓｐａｔｉａｌ・ｔｅｍｐｏｒａｌ

ｗｏｒｄｓ［Ｃ］／／ＢＭＶＣ。２００６．

【１２】ＫｌｌｔｓｅｒＡ，ＭａｒｓｚａｌｅｋＭ。ＳｃｈｍｉｄＣ．Ａｓｐａｔｉｏ．ｔｅｍｐｏｒａｌｄｅｓｃｒｉｐｔｏｒ

ｂａｓｅｄ

ｏｎ

ＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏ—

３Ｄｇｒａｄｉａｎｔｓ［Ｃ］／／ＢＭＶＣ。２００８．

ｆｅａｔｕｒｅｓ

ｆｒｏｍ

ｆ１３】Ｌｏｗｅ

ｍｏｖｉｅｓ［Ｃ］／／ＣＶＰＲ，２００８．

ｉｎｔｅｒｅｓｔ

Ｄ．Ｄｉｓｔｉｎｃｔｉｖｅｉｍａｇｅｓｅａｌｅ－ｉｎｖａｒｉａｎｔｋｅｙ－

【２】ＬａｐｔｅｖＩ，ＭａｒｓｚａｌｅｋＭ，ＳｃｈｍｉｄＣ。ｅｔａ１．Ｌｅａｒｎｉｎｇｒｅａｌｉｓｔｉｃｈｕ－

ｍａｎａｃｔｉｏｎｓｆｒｏｍ

ｐｏｉｎｔｓ［Ｃ］／／ｌＪＣＶ．２００４．６０（２）：９１．１ｌＯ．

【１４】ＪｕｒｉｅＦ，ＴｒｉｇｇｓＢ．Ｃｒｅａｔｉｎｇｅｆｆｉｃｉｅｎｔｃｏｄｅｂｏｎｋｓｆｏｒｖｉｓｕａｌｒｅｃｏｇ・

ｎｉｔｉｏｎ［Ｃ］／／ＩＣＣＶ，２００５．【１５】Ｃｈａｎｇ

ＣＣ，Ｌｉｎ

Ｃ

【３１

Ｌａｐｔｅｖ１０７－１２３．

１．Ｏｎ

ｓｐａｃｅ－ｔｉｍｅｐｏｉｎｔｓ【Ｃ】／／ＩＪＣＶ，２００５，６４：

Ｊ．ＬＩＢＳＶＭ：Ａｌｉｂｒａｒｙｆｏｒｓｕｐｐｏｒｔｖｅｃｔｏｒ

【４】ＬａｐｔｅｖＩ。ＬｉｎｄｅｂｅｒｇＴ．Ｌｏｃａｌｄｅｓｃｒｉｐｔｏｒｓｆｏｒｓｐａｔｉｏ－ｔｅｍｐｏｒａｌ

ｒｅｃ．

ｍａｃｈｉｎｅｓ［ＥＢ／ＯＬ］．ｈｔｔｐ：／／ｗｗｗ．ｃｓｉｅ．ｎｔｕ．ｅｄｕ．ｔｗｈｊｌｉｎ／ｌｉｂｓｖｍ／．

万方数据

动作识别中局部时空特征的运动表示方法研究

作者：作者单位：

雷庆，李绍滋， LEI Qing， LI Shao-zi

雷庆,LEI Qing(厦门大学智能科学与技术系,福建厦门,361005;厦门大学福建省仿脑智能系统重点实验室,福建厦门,361005;华侨大学计算机科学与技术学院,福建厦门,361021)，李绍滋,LI Shao-zi(厦门大学智能科学与技术系,福建厦门,361005;厦门大学福建省仿脑智能系统重点实验室,福建厦门,361005)计算机工程与应用

COMPUTER ENGINEERING AND APPLICATIONS2010,46(34)

刊名：英文刊名：年，卷(期)：

参考文献(15条)

1. Turaga P Machine recognition of human activities:A survey 2008(11)

2. Laptev I. Marszalek M. Schmid C Learning realistic human actions from movies 20083. Laptev I On space-time,interest points 2005

4. Laptev I. Lindeberg T Local descriptors for spatio-temporal recognition 2004

5. Dollar P. Rabaud V. Cottrell G Behavior recognition via sparse spatio-temporal features 20056. Sun Ju. Wu Xiao Hierarchical spatio-temporal context modeling for action recognition 20097. Zhu Guang-yu. Xu Chang-sheng Action recognition in broadcast tennis video 2006

8. Scovanner P. AIi S. Shah M A 3-Dimensional S1FT descriptor and its application to action recognition 2007

9. Blank.Weizmann dataset10. Schuldt KTH dataset

11. Niehles J. Wang H. Fei-Fei L Unsupervised learning of human action categories using spatial-temporal words 2006

12. Klaser A. Marszalek M. Schmid C A spatio-temporal descriptor based on 3Dgradients 200813. Lowe D Distinctive image features from scale-invariant keypoints 2004(2)14. Jurie F. Triggs B Creating efficient codebonks for visual recognition 200515. Chang C C. Lin C J LIBSVM:A library for support vector machines

本文链接：http://d.g.wanfangdata.com.cn/Periodical_jsjgcyyy201034003.aspx

动作识别中局部时空特征的运动表示方法研究

相关内容

热门内容