首页

出自北京大学计算机科学技术研究所语言计算与互联网挖掘研究室

跳转到: 导航, 搜索
语言计算与互联网挖掘研究室从属于北京大学计算机科学技术研究所,成立于2008年7月,负责人为万小军老师。研究室以自然语言处理技术、数据挖掘技术与机器学习技术为基础,对互联网上多源异质的文本大数据进行智能分析与深度挖掘,为互联网搜索、舆情与情报分析、写稿与对话机器人等系统提供关键技术支撑,并从事计算机科学与人文社会科学的交叉科学研究。 研究室当前研究内容包括:1)研制全新的语义分析系统实现对人类语言(尤其是汉语)的深层语义理解;2)综合利用自动文摘、文本生成、文本推荐等技术让机器写出高质量的各类稿件;3)针对多语言互联网文本实现高精度情感、立场与幽默分析;4)其他探索性研究,包括特定情境下的人机对话技术。

新闻

  • (2017-8-7)自然语言处理领域顶级国际会议ACL 2017于近日在温哥华召开,本研究室独立完成的关于生成式自动文摘的学术论文(Jiwei Tan, Xiaojun Wan and Jianguo Xiao: Abstractive Document Summarization with a Graph-Based Attentional Neural Model)入选大会杰出论文(Outstanding Long Paper),具体参见Outstanding and best papers and the decision process
  • (2017-7-1)本研究室独立完成的三篇论文被自然语言处理领域一流国际会议EMNLP2017录用(长文两篇:1. Kui Xu and Xiaojun Wan. Towards a Universal Sentiment Classifier in Multiple Languages;2. Junjie Cao, Sheng Huang, Weiwei Sun and Xiaojun Wan. Quasi-Second-Order Parsing for 1-Endpoint-Crossing, Pagenumber-2 Graphs;短文一篇:Jianmin Zhang and Xiaojun Wan. Towards Automatic Construction of News Overview Articles by News Synthesis)。
  • (2017-6-30)本研究室独立完成的两篇论文被自然语言生成领域重要国际会议INLG2017录用为长文(1. Hongyu Zang and Xiaojun Wan. Towards Automatic Generation of Product Reviews from Aspect-Sentiment Scores; 2. Jin-ge Yao, Jianmin Zhang, Xiaojun Wan, and Jianguo Xiao. Content Selection for Real-time Sports News Construction from Commentary Texts)。
  • (2017-6-30)本研究室两名博士生姚金戈与周新杰顺利毕业并获得博士学位;一名硕士生张恂顺利毕业并获得硕士学位,张恂同学的毕业论文获得研究所优秀硕士论文(共两名)。
  • (2017-5-1)本研究室与蓝色光标传播集团下属北京捷报数据技术有限公司达成战略合作,共同推动自然语言处理与数据挖掘技术在媒体行业的应用,基于全媒体内容为中外企业客户提供危机预警与监测、传播效果评估、产品口碑分析、行业情报等全方位专业信息服务。
  • (2017-3-31)本组独立完成的两篇论文被人工智能领域顶级国际会议IJCAI2017录用为长文(1. Jiwei Tan, Xiaojun Wan and Jianguo Xiao: From Neural Sentence Summarization to Headline Generation: A Coarse-to-Fine Approach;2. Wei Wei and Xiaojun Wan: Learning to Identify Ambiguous and Misleading News Headlines)。其中,第二篇论文的第一作者为本组本科实习生。
  • (2017-3-31)本组独立完成的三篇论文被自然语言处理领域顶级国际会议ACL2017录用为长文(1. Jiwei Tan, Xiaojun Wan and Jianguo Xiao: Abstractive Document Summarization with a Graph-Based Attentional Neural Model;2. Junjie Cao, Sheng Huang, Weiwei Sun and Xiaojun Wan: Parsing to 1-Endpoint-Crossing, Pagenumber-2 Graphs;3. Weiwei Sun, Junjie Cao and Xiaojun Wan: Semantic Dependency Parsing via Book Embedding)。
  • (2017-2-12)本组撰写的一篇综述论文被数据挖掘与信息系统领域国际著名期刊Knowledge and Information Systems录用(Jin-ge Yao, Xiaojun Wan and Jianguo Xiao: Recent Advances in Document Summarization),该论文对近五年自动文摘方向的研究进展进行了系统性总结,并对该方向的研究趋势进行了展望。
  • (2017-1-17)本组与南方都市报社合作推出写稿机器人小南,该款机器人能够自动撰写民生类稿件,已经撰写与发布了多篇广州春运报道,引起国内外媒体的广泛关注。详细报道参见智能时代“小南”驾到
  • 更多...

通知

  • 研究室常年招收重点高校优秀本科实习生,欢迎申请。
  • 研究室招收自然语言处理与文本挖掘相关方向的博士后,欢迎申请。



近期会议

  • AAAI 2018
  • WWW 2018
个人工具