太阳神网站106666宣(文 陈倩/图 关键)2017年4月18日上午,应我院王轩教授的邀请, 英国萨里大学视频语音和信号处理中心(Centre for Vision Speech and Signal Processing, University of Surry, UK)王文武教授来我院进行学术交流,并在A509教室为我院师生做了题目为《Audio-Visual Tracking of Multiple Moving Sources》的学术讲座。
王文武教授于2007年5月起,就职于萨里大学视频语音和信号处理中心,现担任机器听觉实验室联合主任,主要研究领域有:盲信号处理、机器学习与感知、机器听觉、语音与声音信号处理、音视频信号及稀疏信号处理等。迄今为止,在其研究的各领域共发表论文200多篇。
在此次讲座中,王文武教授为我院师生介绍了有关“音视频结合的多个移动源的目标跟踪”在现阶段的最新研究成果,介绍了几种传统目标跟踪算法包括PHD Filter、Particle Filter、 Mean Shift,并详细的讲解了加入音频信息作为辅助的音视频结合的目标跟踪算法。
在过去十年中,使用视听(AV)模式在室内环境中检测和跟踪多个移动的说话人的问题引起了越来越多的关注, 其在多个领域具有广泛的应用前景,例如视频会议中的自动摄像机转向、多说话人场景中的单个说话人辨别,以及安全应用中的监视和监控等。目前,基于AV模式的多目标跟踪仍然存在诸多困难和挑战,包括多模式的融合,对说话人的数量变化及其状态的估计,以及如何处理遮挡、室内光线变化和房间混响等。该讲座介绍了基于贝叶斯框架一些新的方法,解决了AV模式的多目标跟踪存在的部分困难。特别提出了一种自适应粒子滤波算法,SMC-PHD滤波算法和基于稀疏采样的SMC-PHD滤波算法。讲座中王文武教授通过实例演示了这些跟踪算法的性能,并一一解答了学生提出的各种问题。
图1:王文武教授在讲解音视频结合的目标跟踪
图2:王文武教授在介绍目标跟踪方法