[发明专利]摘要生成方法和装置在审
申请号: | 202210318418.1 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114661893A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 莫森·波尔瓦利;盛晨 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/332;G06F16/33;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摘要 生成 方法 装置 | ||
本申请提供了一种摘要生成方法和装置,包括:确定对话文本中各对话语句内的关键词;确定不同关键词之间的相关度以及对话语句内关键词之间的出现顺序;基于出现顺序,确定关键词对对话文本的影响程度;结合不同关键词之间的相关度以及关键词对对话文本的影响程度,确定关键词的重要程度;基于关键词的重要程度,生成对话文本的摘要,摘要包括:对话文本中重要程度符合条件的关键词所在的对话语句。本申请的方案能够更为高效和准确地生成对话文本的摘要。
技术领域
本申请涉及文本处理技术领域,尤其涉及一种摘要生成方法和装置。
背景技术
对话文本是指至少两个对话方之间聊天或者交流的对话语句所构成的文本。
为了能够更为便捷和高效的了解对话文本的内容,经常需要生成对话文本的摘要。如,在客户服务场景中,用户与客服(如,人工客服或者机器人客服等)之间可以通过对话来实现问题咨询等信息交互,而通过提取用户与客服之间对话的对话文本的摘要,能够对用户与客服之间的交互信息进行浓缩,有利于客服服务中的相关人员获得已经讨论过的问题或者解决方案等的概括内容。
为了能够更为准确反映对话文本的内容,就需要合理地提取对话文本的摘要,因此,如何能够更为合理地从对话文本中提取摘要,使得提取的摘要能够更为准确地反映对话文本的内容是本领域技术人员迫切需要解决的技术问题。
发明内容
本申请提供了一种摘要生成方法和装置。
其中,一种摘要生成方法,包括:
确定对话文本中各对话语句内的关键词;
确定不同关键词之间的相关度以及所述对话语句内关键词之间的出现顺序;
基于所述出现顺序,确定所述关键词对所述对话文本的影响程度;
结合不同关键词之间的相关度以及所述关键词对所述对话文本的影响程度,确定所述关键词的重要程度;
基于所述关键词的重要程度,生成所述对话文本的摘要,所述摘要包括:所述对话文本中重要程度符合条件的关键词所在的对话语句。
在一种可能的实现方式中,在所述生成所述对话文本的摘要之前,还包括:
将所述对话文本划分为至少一个对话分区,不同对话分区内的对话语句表征不同类别的对话意图;
所述基于所述关键词的重要程度,生成所述对话文本的摘要,包括:
基于所述关键词的重要程度,确定所述对话分区内用于组成摘要的目标对话语句,得到各对话分区内的目标对话语句组成的摘要。
在一种可能的实现方式中,确定对话语句内关键词之间的出现顺序包括:
对于每个关键词,确定所述关键词的各共现关键词以及所述关键词与其共现关键词首次共同出现的共现对话语句,所述关键词的共现关键词为与所述关键词同时出现在一个对话语句内的其他关键词;
确定所述共现对话语句内所述关键词与其共现关键词之间的出现顺序。
其中,一种摘要生成装置,包括:
关键词确定单元,用于确定对话文本中各对话语句内的关键词;
关联确定单元,用于确定不同关键词之间的相关度以及所述对话语句内关键词之间的出现顺序;
影响确定单元,用于基于所述出现顺序,确定所述关键词对所述对话文本的影响程度;
重要度确定单元,用于结合不同关键词之间的相关度以及所述关键词对所述对话文本的影响程度,确定所述关键词的重要程度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210318418.1/2.html,转载请声明来源钻瓜专利网。