[发明专利]会话处理方法、装置和存储介质有效
申请号: | 201811543826.7 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109830231B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 王硕寰;孙宇;于佃海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;H04L12/58 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 荣甜甜;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会话 处理 方法 装置 存储 介质 | ||
本发明提供一种会话处理方法、装置和存储介质,该方法包括:若当前会话消息中存在指代表述,则获取当前会话消息的待补充内容;根据历史会话消息对当前会话消息的待补充内容进行补充,历史会话消息为语义完整的消息;根据当前会话消息的完整的语义,获取当前会话消息的响应消息;播放响应消息。本发明通过历史会话消息对存在指代表述的当前会话消息中的待补充内容进行补充,使得当前会话消息的语义完整,进而向用户返回响应消息,本发明避免了现有技术中预先标注工作量大的问题,且适用于所有的技术领域。
技术领域
本发明涉及语音交互技术领域,尤其涉及一种会话处理方法、装置和存储介质。
背景技术
随着人工智能(Artificial Intelligence,AI)的快速发展,目前的智能客服、智能助手、车载导航和智能家居等越来越多的产品和应用引入了对话式的人机交互方式。在人机单轮交互问答中,通常通过标识多个单轮交互模板,当获取的用户的问题为标识的模板中的问题时,通过结构化提取的方式获取用户的意图;如标识的模板为“从A地至B地的火车票”,当用户的问题为“帮我查询从北京到西安的火车票”,该问题符合标识的模板,则提取该问题中用户的意图为“查询火车票”,意图属性为“出发地北京,目的地西安”。
现有技术中通过标注模板的方式实现多轮交互式问答,这种方式需要预先标注大量的模板,增大了数据的标注难度,同时往往需要大量的数据才能达到效果,同时标注的数据可能适用于某一领域,迁移能力差。且在多轮交互式问答中,用户在提问的同时,会建立相应的语境,在这个语境中的接下来的问题,往往会出现指代和省略现象,由此造成单个提问语义缺失的问题,给检索带来大量的麻烦。
发明内容
本发明提供一种会话处理方法、装置和存储介质,避免了现有技术中预先标注工作量大的问题,且适用于所有的技术领域。
本发明的第一方面提供一种会话处理方法,包括:
若当前会话消息中存在指代表述,则获取当前会话消息的待补充内容;
根据历史会话消息对所述当前会话消息的待补充内容进行补充,所述历史会话消息为语义完整的消息;
根据所述当前会话消息的完整的语义,获取所述当前会话消息的响应消息;
播放所述响应消息。
可选的,所述若当前会话消息中存在指代表述,则获取当前会话消息的待补充内容,包括:
若所述当前会话消息中包含有预设指代词,则所述当前会话消息中的预设指代词为所述待补充内容;
所述根据历史会话消息对所述当前会话消息的待补充内容进行补充,包括:
根据所述历史会话消息的语义,在所述历史会话消息中确定所述预设指代词对应的代指表述;
将所述预设指代词对应的代指表述替换所述当前会话消息中的所述预设指代词。
可选的,所述若当前会话消息中存在指代表述,则获取当前会话消息的待补充内容,包括:
若所述当前会话消息的句式属于第一预设句式,则所述当前会话消息中的共指指代词为所述待补充内容,所述第一预设句式为存在共指指代的句式,所述共指指代用于表征在所述历史会话消息中存在与所述共指指代词的语义相似度大于相似度阈值的表述;
所述根据历史会话消息对所述当前会话消息的待补充内容进行补充,包括:
对所述历史会话消息进行分词,获取所述历史会话消息对应的多个第一候选表述;
获取每个所述第一候选表述与所述共指指代词的第一语义相似度;
若所述第一语义相似度的最大值大于所述相似度阈值,则将所述第一语义相似度的最大值对应的第一候选表述替换所述共指指代词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811543826.7/2.html,转载请声明来源钻瓜专利网。