万博官网man bet x2NAVIGATION

计算机学院研究生科研成果被CCF A类国际学术会议ACM Multimedia 2021录用为口头报告论文

时间:2021-11-07 来源: 作者:计算机科学与技术学院 摄影: 编辑:王小轩 上传:

近日,2021国际顶级会议ACM Multimedia首次在四川成都举办,计算机学院朱艾春老师指导的2021级研究生王子杰同学的长文“DSSL:Deep Surroundings-person Separation Learning for Text-based Person Retrieval”被大会录用为Oral Presentation(口头报告论文,录用率约9%)。

ACM Multimedia有着严苛的录用标准,2021年的投稿量达2544篇,经过Desk Rejects后有1942篇论文进入审稿阶段,最终大会仅录用179篇口头报告论文,363篇海报论文。ACM Multimedia是计算机学科多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的该领域唯一的A类国际学术会议。

该论文针对跨模态行人重识别任务展开研究,并提出了一种深度环境行人分离学习模型(Deep Surroundings-person Separation Learning model, DSSL)。现有算法一般都致力于学习一个公共空间映射,以从异质的多模态数据中提取富有鉴别能力的特征。但由于高维数据的复杂性,无约束的映射方法很难在正确捕捉行人特征的同时剥离掉干扰信息。论文提出了一种深度环境行人分离学习模型(DSSL),以进行高效精准的行人特征提取与匹配。如图2及图3所示,环境行人分离与融合机制(SPSM+SPFM)起到了关键性的作用,在信息正交约束下,通过行人特征的分离与跨模态融合重构匹配,从而实现精准的环境行人剥离与匹配,极大提升了模型精度。此外,为了进一步推动该课题后续研究的发展,该研究团队在MSMT17基础上,构建了一个全新的真实场景跨模态行人重识别数据集(Real Scenarios Text-based Person Reidentification dataset,RSTPReid),其中每个行人的5张图像均由不同相机在不同的时间、地点、天气、光照、视角等条件下拍摄得到。目前,该数据集发布在GitHub实验室主页上:https://github.com/NjtechCVLab/RSTPReid-Dataset,以供其他学者学习和使用。

作者:计算机科学与技术学院;审核:万夕里、刘学军

167F9


万博官网man bet x2
Baidu