[发明专利]一种对话主题确定方法及装置在审
申请号: | 202210333544.4 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114676257A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/30 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 主题 确定 方法 装置 | ||
本说明书公开了一种对话主题确定方法及装置,通过确定若干对话数据以及各对话数据分别对应的执行结果,并针对指定业务的每类执行结果,将该类执行结果中包含的各对话数据进行聚类,确定各聚类簇,以及各聚类簇分别对应的关键词,再根据各聚类簇中包含的对话数据,确定该类执行结果中各关键词的评价指标,进而根据各关键词在各类执行结果中的评价指标,以及预设的各类执行结果的第二权重,确定该指定业务对应的对话主题。本方案确定出的对话主题与指定业务强相关,因而保证了根据对话主题和用户开展对话时,对话的用户执行该对话主题对应的指定业务的概率,提高了业务引导的效率。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种对话主题确定方法及装置。
背景技术
目前,随着计算机技术的发展,业务提供方的工作人员需要根据对话主题和用户进行对话,以引导用户执行业务。因此,如何确定对话主题成为一个重要的问题。
一种常用的确定对话主题的方法,是由业务提供方的工作人员根据自身经验总结历史对话中的关键词,作为目标对话主题。
但是,由工作人员根据自身经验确定出的对话主题,与该对话主题对应的业务是否执行成功,没有明显相关性,使得根据现有技术确定出的对话主题进行业务引导时的效率较低。
发明内容
本说明书提供一种对话主题确定方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供一种对话主题确定方法,包括:
确定若干对话数据以及各对话数据分别对应的执行结果,所述执行结果用于指示对话数据对应的用户对指定业务的执行结果;
针对所述指定业务的每类执行结果,对该类执行结果对应的各对话数据进行聚类,得到各聚类簇,并确定所述各聚类簇分别对应的关键词;
根据各聚类簇包含的各对话数据,分别确定各聚类簇的第一权重,以确定该类执行结果中各关键词的评价指标;
根据各关键词在所述指定业务的各类执行结果中的评价指标,以及预设的各类执行结果的第二权重,确定所述指定业务对应的关键词,作为所述指定业务的对话主题。
可选的,对该类执行结果对应的各对话数据进行聚类,得到各聚类簇,具体包括:
针对该类执行结果对应的每个对话数据,确定该对话数据中包含的各语句;
确定所述各语句分别对应的分词序列,按照所述各语句在该对话数据中的先后顺序,将各分析序列依次输入语义模型,得到该对话数据对应的语义向量;
对属于该类执行结果的各语义向量进行聚类,得到各聚类簇。
可选的,确定所述各聚类簇分别对应的关键词,具体包括:
针对每个聚类簇,确定该聚类簇包含的各语义向量分别对应的对话数据;
对各对话数据的分词序列中各分词的出现频次进行统计,并根据统计结果,确定若干中心分词;
将各中心分词输入所述语义模型中,确定各中心分词对应的词向量;
针对每个词向量,根据该词向量和该聚类簇包含的各语义向量的相似度,确定该词向量对应于该聚类簇的相似度;
根据各词向量分别对应于该聚类簇的相似度,确定该聚类簇对应的关键词。
可选的,确定各聚类簇的第一权重,具体包括:
针对每个聚类簇,确定该聚类簇包含的对话数据的数量;
根据所述数量,确定该聚类簇的第一权重,所述第一权重和所述数量正相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210333544.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板及其制备方法与显示装置
- 下一篇:一种大豆低温软化锅及其使用方法