非可控人体识别

主题:非可控人体识别

摘要:

随着智慧城市、公共安全应用的日益普及,对于监控视频的人体识别和智能行为理解与识别变得日益重要。由于监控视频个体类别众多、区别细微、行为复杂等特点,对监控视频的行为个体的身份识别,跨场景重识别和行为识别和理解,已成为计算机视觉领域的最新挑战。过去十年来是人脸识别和行人重识别的大发展时代,许多深度学习方法取得了技术和应用突破,并且最近多家科技公司不断刷新各种榜单(在类似LFW的人脸数据库上达到99.8%以上的验证准确率和类似Market的行人数据库上达到97%以上的匹配率),似乎给学界或工业界一个错觉,人体识别的相关问题已经解决了。然而,实际上人体识别在业内还存在许多问题,不但在学术上,而且在工业实际应用中,并没有如刷数据库那般神奇。

本讲习班主要面向视频监控等应用的核心技术挑战,围绕非可控人体识别展开,包括行人重识别、动作识别和人脸识别。具体而言,本讲习班内容大致如下:

行人重识别:行人重识别仍然有许多悬而未决的严重影响重识别应用的核心问题,比如光照、衣服变换等。此外,目前大多数算法的性能非常依赖大规模的标注数据,如何应对大量弱标注或无标注数据下的行人重识别建模,目前仍然是一个迫切需要解决的问题。本次讲习班主要回顾当前行人重识别的监督学习的主要算法,重点介绍最近在克服小标注数据的行人重识别研究,以及一些行人重识别方向上的开放性研究。

动作识别:介绍在监控视频行为识别和理解方面的最新成果。首先,我们将简要介绍行为识别技术的发展和主要类别;其次,我们将介绍我们课题组在监控视频行为识别方面的工作,包括多目标轨迹鲁棒提取、基于轨迹信息的行为识别、基于时空序列的行为识别、以及密集场景行为理解等。最后,我们将展示我们的一些具体成果和应用演示,并讨论一下当前行为理解的最新挑战。

人脸识别:人脸识别鲁棒性和公平性受到训练数据的标签噪声、不平衡类别、特征分布等偏差因素严重影响。如何减小数据收集和标注的偏差,以及如何在偏差数据条件下保证识别的公平性和安全性成为亟待解决的问题。本次讲习班主要汇报课题组近期在大规模数据自动清洗、众包标签估计、面向长尾数据和对抗攻击的训练方法、种族偏差评估和去偏差算法等工作,讨论一些人脸识别方向上的开放性研究问题。

讲师介绍:

郑伟诗博士,中山大学数据科学与计算机学院教授,机器智能与先进计算教育部重点实验室副主任。他主要面向大规模智能视频监控里的行人身份识别与动作分析,展开视频图像信息与信号的识别与预测研究,并围绕该应用开展大规模机器学习的算法和理论研究。关于面向大规模监控网络下的行人追踪问题,他在国内外较早和持续深入开展跨视域行人重识别的研究,发表一系列以跨视域度量学习为主线的研究工作,并最近集中展开无监督和弱标注学习建模,力图解决“大数据小标注”下的图像视频分析问题。他已发表120余篇主要学术论文,含12篇IEEE T-PAMI和IJCV论文和其他90余篇发表在其他图像识别和模式分类等国际主流权威期刊和中国计算机学会推荐A类国际学术会议。担任Pattern Recognition等期刊的编委,担任CVPR2021、IJCAI 2019/2020、AAAI 2020、BMVC 2018/2019 Area Chair/SPC等。他是IEEE MSA TC 委员。他主持国家重点研发课题一项、国家自然科学基金委-广东大数据科学中心 中心项目(集成项目)课题一项及其他5个国家级项目。获广东省自然科学奖一等奖、广东省科学技术进步奖二等奖等;获国家优秀青年科学基金、英国皇家学会牛顿高级学者基金和广东省创新领军人才项目支持。
林巍峣,上海交通大学教授。分别于2003年和2005年获得上海交通大学学士和硕士学位,并于2010年获得美国华盛顿大学西雅图分校获得博士学位。曾在包括Motorola, Real Networks和Thomson Technology在内的多家公司的研究机构担任Research Intern。主要研究方向包括计算机视觉、视觉监控、视频行为理解、视频及语义信息编码等。林博士现任IEEE T-IP、T-CSVT、T-ITS等期刊编委及ICPR’20, BMVC’19, MM’18、ICIP’19、ICME’18等领域主席,并任IEEE MMSP、IEEE MSA TC、IEEE MMTC等学术专业委员会委员。在相关领域共发表期刊论文100余篇,含IEEE Transactions系列及CVPR、ICCV、AAAI等权威期刊和会议论文40余篇,获专利18项。近年来,林博士相继获得2018教育部“青年长江”学者、ICME’19多媒体学术新星(Multimedia Rising Star)、2019上海市五四青年奖章等荣誉。详细介绍请见个人主页:https://weiyaolin.github.io/
邓伟洪,北京邮电大学教授,博士生导师。2004、2009年于北京邮电大学获工学学士和博士学位。2007年国家公派赴澳大利亚悉尼大学进行博士联合培养,2009年至今,在北京邮电大学信息与通信工程学院任讲师、副教授、教授。从事模式识别与计算机视觉的基础理论研究,并应用到人脸识别、表情识别、行人再识别、细粒度图像识别等。近年来主持国家自然科学基金和国家重点研发计划课题等项目十余项,担任IJCAI 2020、ICPR 2020、ICME2020 Area Chair/SPC等,在IEEE TPAMI、TIP、TIFS、IJCV、PR等国际期刊以及ICCV、CVPR、ECCV、NIPS、AAAI、SIGIR等国际会议发表论文100多篇。曾入选北京市优秀博士学位论文、教育部“新世纪优秀人才”、北京市“科技新星”。