[发明专利]一种短会话新问题生成方法、存储介质和人机交互装置在审
申请号: | 201911321137.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111159370A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 杨雷;李昱;王全礼;唐汇;蒲柯锐 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会话 新问题 生成 方法 存储 介质 人机交互 装置 | ||
1.一种短会话新问题生成方法,其特征在于:
获取候选新问题;
形成相似候选新问题集合,将所述候选新问题按照相似程度聚类,获得相似候选新问题集合;
提取标签词,提取所述相似候选新问题集合中的预定词频的业务词汇作为所述相似候选新问题集合的标签词;
生成主旨句,根据所述相似候选新问题集合的内容生成主旨句;
生成新问题,根据所述相似候选新问题集合中预定数量的候选新问题、所述主旨句和所述标签词生成新问题。
2.根据权利要求1所述的短会话新问题生成方法,其特征在于:所述主旨句为所述候选新问题集合中预定频率的候选新问题或者根据所述候选问题集合归纳形成的语句。
3.根据权利要求2所述的短会话新问题生成方法,其特征在于:所述标签词为所述候选新问题集合中预定频率的业务词汇。
4.根据权利要求1所述的短会话新问题生成方法,其特征在于:获取候选新问题包括:读取短会话内容,计算所述短会话内容中新问题的综合相似度和标准问题库中问题的综合相似度的比值,若所述比值满足第一预设条件,则将所述短会话内容中的新问题作为候选新问题。
5.根据权利要求1所述的短会话新问题生成方法,其特征在于:形成相似候选新问题集合,将所述候选新问题按照相似程度聚类,获得相似候选新问题集合包括:选择一条候选新问题,生成第一候选新问题主旨句和第一候选新问题集合,读取下一条候选新问题,计算所述第一条候选新问题的综合相似度和所述下一条候选新问题的综合相似度的比值,若所述比值满足第二预设条件,则将所述读取的下一条候选新问题加入所述第一候选新问题集合。
6.根据权利要求4或者5所述的短会话新问题生成方法,其特征在于:所述第一预设条件为所述比值小于0.8,所述第二预设条件为所述比值大于等于0.8。
7.根据权利要求4或5所述的短会话新问题生成方法,其特征在于:所述综合相似度计算方式为:
Q=C·α+W·β+S·γ
其中Q为综合相似度得分;
C为基于内容计算的相似度,α为基于内容计算的相似度对应的权重值,α在[0.7-0.9]取值;
W为基于关键词命中计算的相似度,β为基于关键词命中计算的相似度对应的权重值,β在[0.05-0.15]取值;
S:基于词顺序计算的相似度,γ为基于词顺序计算的相似度对应的权重值,γ在[0.05-0.15]取值。
8.根据权利要求7所述的短会话新问题生成方法,其特征在于:所述α取0.9,所述β取0.05;所述γ取0.05。
9.根据权利要求1所述的短会话新问题生成方法,其特征在于:在获取候选新问题前滤除短会话内容中的日常对话、语气词、特殊字符、单字节内容、数字或者重复的内容。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的方法。
11.一种人机交互装置,其特征在于,所述人机交互装置包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的短会话新问题生成程序,所述短会话新问题生成程序被所述处理器执行时实现如权利要求1至9中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911321137.6/1.html,转载请声明来源钻瓜专利网。