光熙论坛第786期:文本摘要技术介绍

主讲人:陈喆 计算学部博士研究生

研究反向:文本摘要,文本分类,文本相似性检测

时间:2023年6月20日 08:00-09:00

会议方式:腾讯会议:653-348-033

内容介绍:

文本摘要是指通过各种技术,对文本或者是文本集合,抽取、总结或是精炼其中的要点信息,用以概括和展示原始文本(集合)的主要内容或大意。作为文本生成任务的主要方向之一,从本质上而言,这是一种信息压缩技术。文本摘要的目的是为了让用户在当今世界海量的互联网数据中找到有效的信息。按照输入文本类型的不同,可以分为单文档文本摘要和多文档文本摘要;按照实现技术方案的不同,可以分为抽取式文本摘要、生成式文本摘要、混合式文本摘要;按照摘要目的的不同,可以分为关键词摘要、短语摘要、句子摘要、段落摘要等。

本报告的目的是介绍文本摘要的相关技术及目前主流的模型在各文本摘要数据集上的性能,希望与各位交流探讨机器学习方向的最新研究成果。