刘奕群是一位工学博士,现任
清华大学计算机科学与技术系副教授和党委书记。他主要从事信息检索和自然语言处理领域的研究工作,并承担了国家重点研发计划和自然科学基金重点项目等重要科研任务。他提出了互联网认知搜索的完整创新技术链条,相关成果在多个互联网搜索引擎和最高人民法院司法公开平台等发挥重要作用。刘奕群获得了本领域重要国际学术会议的8项最佳论文奖项,并获得了20余项专利授权。2021年4月12日,清华大学长聘教授聘任仪式举行,刘奕群被聘为清华大学长聘教授。
教育背景
工学学士(
计算机科学与技术),
清华大学,中国,2003;
工学博士(计算机科学与技术),清华大学,中国,2007.
社会兼职
清华大学计算机科学与技术系:党委副书记(2011-);
第三届全国学生计算语言学研讨会(SWCL 2006): 程序委员会主席(2006).
科研概况
研究领域
网络信息检索
自然语言处理
研究概况
主要研究兴趣集中在网络搜索引擎技术,尤其是基于用户行为分析方法改进搜索引擎性能这一研究领域。面对海量繁杂的网络数据与千差万别的用户行为,传统的信息检索、机器学习、自然语言处理技术在搜索引擎系统中的应用面临着极大的挑战。为应对这一挑战,利用搜索引擎海量规模的用户行为数据信息,发挥“用户群体智慧”的作用是非常必要的。基于这一思路,在国家自然科学基金重点项目、青年项目、教育部博士点基金项目与
清华大学—
搜狐搜索技术联合实验室的支持下开展了一系列相关研究。
在“互联网页面质量评估”、“互联网垃圾网页与非法资源识别”、“搜索引擎检索效果与广告效果评估”、“搜索引擎查询推荐”、“互联网用户浏览推荐”等搜索引擎技术领域开展了相关研究,取得了较好的研究成果。相关成果发表在JASIST、WWW、CIKM、WSDM等相关研究领域国际著名期刊与会议上,并申请国家发明专利8项(其中已获得3项授权)。研究成果同时通过
清华大学—搜狐搜索技术联合实验室的校企合作平台应用到搜狗搜索引擎中,取得了良好的实际应用效果。
研究课题
国家自然科学基金重点课题:下一代信息检索(2008-2011);
国家自然科学基金青年基金课题:基于网络
用户行为分析的垃圾网页识别方法研究(2010-2012);
“清华—
搜狐”搜索技术联合实验室合作课题:搜索引擎日志分析、输入法日志分析、用户查询推荐、用户浏览推荐、垃圾页面识别、学术共享资源建设等(2010-2012).
奖励与荣誉
清华大学综合优秀一等奖学金(2004,2005,2006);
清华大学“一二·九”辅导员奖(2005);
清华大学“林枫”优秀辅导员奖(2008);
清华大学优秀党建与思想政治工作者(2011);
清华大学优秀教材一等奖(第一完成人)(2012);
清华大学教学成果一等奖(思想政治类,第二完成人)(2012);
亚洲信息检索会议(AIRS)最佳论文
提名奖,最佳海报论文奖(2013);
ACM信息检索会议(SIGIR)最佳论文提名奖(2015);
北京市科学技术一等奖(技术发明类,第一完成人)(2015);
清华大学“刘冰”优秀辅导员奖(2015);
清华大学学术新人奖(2016);
国家自然科学基金优秀青年基金(2016);
ACM信息检索会议(SIGIR)最佳学生论文奖(2017);
ACM CIKM2018会议最佳论文奖(Best Overall Paper);
ACM信息检索国际会议(SIGIR)最佳短论文
提名奖(2018);
ACM信息检索理论会议(ICTIR)最佳短论文提名奖(2019);
科技部科技创新领军人才(2020);
学术成果
Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma.
数据 Cleansing for Web Information Retrieval using Query Independent Features. Journal of the American Society for Information Science and Technology (JASIST), Volume 58, Issue 12, Pages 1884-1898, 2007.10.
Yiqun Liu, Rongwei Cen, Min Zhang, Shaoping Ma, Liyun Ru. Identifying Web Spam with User Behavior Analysis. The Fourth International Workshop on Adversarial Information Retrieval on the Web. 2008.4.
Yiqun Liu, Yijiang Jin, Min Zhang, Shaoping Ma, Liyun Ru, User Browsing Graph: Structure, Evolution and Application. Late breaking result session in Second ACM International Conference on Web Search and
数据 Mining (WSDM 2009).
Liu, Y., Zhang, M., Ma, S., and Ru, L. 2008. User behavior oriented web spam detection. In Proceeding of the 17th international Conference on World Wide Web (Beijing, China, April 21 - 25, 2008). WWW '08. ACM, New York, NY, 1039-1040.
Rongwei Cen, Yiqun Liu, Min Zhang, Bo Zhou, Liyun Ru, Shaoping Ma. Exploring Relevance for Clicks. In Proceedings of The 18th ACM Conference on Information and Knowledge Management. (CIKM'09) 2009.
Rongwei Cen, Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma. Web Observation from a User
透视 In Proceedings of the 2009 IEEE/WIC/ACM international Joint Conference on Web intelligence and intelligent Agent Technology - Volume 01. IEEE
计算机 Society, Washington, DC, 291-294.
Yiqun Liu, Canhui Wang, Min Zhang, Shaoping Ma, Web
数据 Cleansing for Information Retrieval using Key Resource Page Selection, Proceedings of the 14th International World Wide Web conference, Pages 1136-1137, 2005.
Yiqun Liu, Yupeng Fu, Min Zhang, Shaoping Ma, Liyun Ru. Automatic Search Engine Performance Evaluation with Click-through
数据 Analysis. in Proceedings of the 16th international Conference on World Wide Web (Banff, Alberta, Canada, May 08 - 12, 2007). WWW '07. ACM, New York, NY, 1133-1134.
Yiqun Liu, Canhui Wang, Min Zhang, Shaoping Ma, Finding "Abstract Fields" of Web Pages and Query Specific Retrieval--THUIR at TREC 2004 Web Track, NIST Special Publication: SP 500-261, Proceedings of the Thirteenth Text Retrieval Conference (TREC 2004).
Yiqun LIU, Bo ZHOU, Min ZHANG, Shaoping MA, Liyun RU, Effectiveness of Online Sponsored Search Based on User Log Analysis. Journal of Computational Information Systems. Vol.5(3): pp 1175-1184. 2009.
Yiqun Liu, Canhui Wang, Min Zhang, Shaoping Ma, Learning-based Web
数据 Cleansing for Information Retrieval, Journal of Computational Information Systems, Vol 1(n4): pp. 709-716, 2005.
Qianli Xing, Yiqun Liu, Rongwei Cen, Min Zhang, Shaoping Ma, Liyun Ru: Are search engine users equally reliable? WWW 2010: 1207-1208.
Weize Kong, Yiqun Liu, Shaoping Ma, Liyun Ru: Detecting epidemic tendency by mining search logs. WWW 2010: 1133-1134.
Rongwei Cen, Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma: Study language models with specific user goals. WWW 2010: 1073-1074.
刘奕群,岑荣伟,张敏,
茹立云,马少平.基于
用户行为分析的搜索引擎自动性能评价.软件学报19(11):3023-3032.2008.12.
刘奕群,张敏,马少平.基于改进决策树算法的网络关键资源页面判定。软件学报, Vol. 16(11): pp. 1958-1966, 2005.
马少平,刘奕群.大海捞针亦有道——中文信息检索技术的现状与展望。
中国计算机学会通讯2008年第2期.
刘奕群,马少平,洪涛,
刘子正搜索引擎技术基础.
清华大学出版社,北京,2010
人物事件
刘奕群作为第一完成人获得
北京市科学技术奖一等奖、
钱伟长中文信息处理科学技术奖一等奖。他还先后获得自然基金委优秀青年基金、国家级科技创新领军人才、国际
计算机学会杰出会员。
刘奕群还兼任
中国人工智能学会副秘书长、中国中文信息处理学会信息检索专委会主任、国际知名期刊《Foundations and Trends in IR》主编等。
2021年4月12日,
清华大学长聘教授聘任仪式在
炎黄艺术馆隆重举行,刘奕群被清华大学聘为长聘教授。