信息学院师生赴法国参加信息检索领域顶会SIGI_靖江市第一高级中学

2019-08-14 05:55:30 外语培训 53

7月21-25日,中国人民大学信息学院院长文继荣团队的数篇研究成果论文接连被信息检索领域顶级国际会议国际计算机协会信息检索大会(SIGIR)接受,并受邀到法国巴黎参加ACM SIGIR 2019进行学术报告。由文继荣带队,四位老师和四位同学在会议期间报告了两篇长文,和四篇短文,信息学院教授徐君获SIGIR 2019 时间检验提名奖(Test of Time Award Honorable Mention)。

信息学院师生赴法国参加信息检索领域顶会SIGI_靖江市第一高级中学

(信息学院师生在SIGIR会议的合影)

(左起:窦志成教授、徐君教授、赵鑫副教授、文继荣教授、白婷、霍宇琦、卢淑祺、卢遥)

SIGIR(ACM International Conference on Research and Development in Information Retrieval)国际计算机协会信息检索大会是一个展示信息检索领域中各种新技术和新成果的重要国际论坛,专注于信息存储、检索和传播的各个方面,同时也是中国计算机学会推荐国际学术会议A类会议。文继荣受邀担任SIGIR 2020程序委员会主席(PC Co-Chair),窦志成受邀担任本次SIGIR 2019短文程序委员会主席(Short Paper PC Co-Chair),这是对中国人民大学在信息检索数据挖掘领域和对中国大陆学者的高度肯定。

本科生卢淑祺于会议上口头报告了在窦志成、文继荣的共同指导下,以第一作者完成的论文“基于有限有噪点击数据的对抗个性化搜索框架(PSGAN: A Minimax Game for Personalized Search with Limited and Noisy Click Data)”,论文通过使用生成对抗网络(GAN)的对抗学习,在一定程度上缓解了当前个性化搜索中的高质量数据稀少问题,提升了个性化搜索的效果。本论文是中国人民大学与加拿大蒙特利尔大学合作的论文。

信息学院师生赴法国参加信息检索领域顶会SIGI_靖江市第一高级中学

(卢淑祺在SIGIR大会上作报告)

白婷,中国人民大学2014级博士生,于会议上口头报告了由赵鑫、文继荣指导的“基于用户长短期需求的连续时间推荐(CTRec: A Long-Short Demands Evolution Model for Continuous-Time Recommendation)”,该论文首次提出了并定义了连续时间推荐问题,采用基于用户长、短期需求的自注意力模型 CTRec,解决了电商推荐系统中存在的重复推荐问题,并在SIGIR大会上引起亚马逊等工业界电商企业的关注,具有研究和实用价值。该论文也是人民大学与加拿大蒙特利尔大学、清华大学合作交流的成果,体现了大数据分析与智能实验室为学生提供的前沿、开放的研究环境和氛围。

信息学院师生赴法国参加信息检索领域顶会SIGI_靖江市第一高级中学

(白婷在SIGIR大会上作报告)

博士生霍宇琦和研究生卢遥与会议上展示了由卢志武和文继荣共同指导的论文“粗粒度到细粒度的渐进识别分类(Coarse-to-Fine Grained Classification)”,其他作者还包括信息学院博士生牛玉磊。论文提出了一种渐进识别任务,即尝试同时识别清晰图片与模糊图片。文章提出了新型的多任务多线性池化方法,能够同时在不同分辨率分类任务下取得高准确率。

赵鑫在会议上展示了两篇论文,第一篇论文“基于群组代表的冷启动矩阵分解算法(Local Representative-Based Matrix Factorization for Cold-Start Recommendation)”,尝试用基于简易交互的方法改善推荐系统中的冷启动情况下的推荐效果,即当一个新用户来到一个已经运转一定时间的推荐系统,如何生成有效的推荐。本文是一个联合工作,第一作者为中科院软件所博士石磊(目前在百度就职)。第二篇论文“在线测评网站中的主题和难度的自动学习方法(Automatically Learning Topics and Difficulty Levels of Problems in Online Judge Systems)”,关注如何基于用户的学习记录数据来自动生成相应的标注信息以改进现在的在线测评系统(Online Judge Systems)的使用体验。本工作设计了一个两模式的概率主题模型,能够推断题目的主题信息。并且基于背景信息的竞赛模型,来推断题目的难度。

徐君团队展示了论文“基于策略和价值网络的命名实体识别方法(Name Entity Recognition with Policy-Value Networks)”并和参会者进行了互动交流,该论文创新地提出在深度强化学习的框架下解决命名实体识别问题,并以马尔科夫决策过程为工具对该任务进行描述和求解,取得了良好的效果。论文所提出的方法能广泛应用于自然语言处理中其它序列标注任务。