[发明专利]话题切换标记方法、装置及计算机设备有效
申请号: | 202110846455.5 | 申请日: | 2021-07-26 |
公开(公告)号: | CN113505596B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 熊为星 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 梁韬 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话题 切换 标记 方法 装置 计算机 设备 | ||
本申请实施例提供了一种话题切换标记方法、装置及计算机设备,其中方法包括:将每个对话内的多个连续交互的聊天语句进行词语分割;根据每个对话分割出的词语所属的话题类别,统计每个对话所涉及的话题切换方向及切换频次,其中,话题切换方向涉及源话题和切换后的目标话题;筛选全部对话的话题切换方向中,切换频次满足第一预设条件的目标话题切换方向,并标记所述目标切换方向所涉及的源话题和目标话题。通过统计的方式,将主题切换的概率信息统计出来,应用于对话机器人在对话的过程中,为对话机器人提供更符合人类聊天需求的话题切换数据。
技术领域
本申请涉及数据处理领域,尤其涉及一种话题切换标记方法、装置及计算机设备。
背景技术
根据人类对话聊天的特点来看,人类在聊一个话题时,随着聊天内容的深入,通常会切换到与上一个话题关系较为密切的另一个话题上,例如由地域的话题切换到饮食习惯的话题。可见,人类聊天时话题切换的场景较多,且更符合人类的聊天需求。
而在当前的对话或闲聊机器人的闲聊主要分为两大类,一类是检索式的闲聊,即获取大量的闲聊语料对,对当前用户会话内容进行语义相似度检索,返回最相似的闲聊语料作为答案返回给用户;另一类是生成式的闲聊,通过深度学习模型对训练语料进行学习,该模型架构通常是encoder-decoder模式,并针对用户会话内容灵活生成答案返回给用户。
检索式闲聊机器人给出的闲聊内容语句通顺、更接近人类语言的表述,但灵活性低,且受限于闲聊语料库的大小及语义匹配算法的精度及效率;而生成式闲聊机器人生成的内容灵活的同时,内容确定性较低,体现在语句的通顺性、友好性、前后话题的统一性、趣味性等方面。
但限于当前的中文开源的闲聊数据较少,且多数是单轮或多轮的对话数据,数据几乎没有其它的额外信息。导致生成式模型无法利用更多的信息来生成具有话题统一的对话内容。可见,现有的闲聊机器人所使用的话题闲聊内容较为单一,无法满足人类的真实聊天的灵活性和趣味性。
发明内容
为了解决上述技术问题,本申请实施例提供了一种话题切换标记方法、装置及计算机设备。
第一方面,本申请实施例提供了一种话题切换标记方法,包括:
将每个对话内的多个连续交互的聊天语句进行词语分割;
根据每个对话分割出的词语所属的话题类别,统计每个对话所涉及的话题切换方向及切换频次,其中,话题切换方向涉及源话题和切换后的目标话题;
筛选全部对话的话题切换方向中,切换频次满足第一预设条件的目标话题切换方向,并标记所述目标切换方向所涉及的源话题和目标话题。
第二方面,本申请实施例提供了一种话题切换标记装置,包括:
分割模块,用于将每个对话内的多个连续交互的聊天语句进行词语分割;
统计模块,用于根据每个对话分割出的词语所属的话题类别,统计每个对话所涉及的话题切换方向及切换频次,其中,话题切换方向涉及源话题和切换后的目标话题;
标记模块,用于筛选全部对话的话题切换方向中,切换频次满足第一预设条件的目标话题切换方向,并标记所述目标切换方向所涉及的源话题和目标话题。
第三方面,本申请实施例提供了一种计算机设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述计算机程序在所述处理器运行时执行第一方面中任一项所述的话题切换标记方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序在处理器上运行时执行第一方面中任一项所述的话题切换标记方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110846455.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通信基站和通信基站系统
- 下一篇:不锈钢体裁切装置