[发明专利]基于人工智能的对话方法、装置及计算机可读介质有效
申请号: | 201711390831.4 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108170749B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 徐新超;刘占一;吴文权 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于人工智能的对话方法、装置及计算机可读介质。其方法包括:接收用户的输入语句以及输入语句对应的上文语句;根据输入语句,从预设的语料库中获取对应的多个候选对话语句;根据输入语句、上文语句、各候选对话语句以及预先训练的分值预估模型,为各候选对话语句打分;根据多个候选对话语句的打分,从多个候选对话语句中获取目标对话语句,实现对话。本发明的技术方案,根据输入语句以及输入语句的上文语句,获取目标对话语句,充分参考了语境,从而能够有效地提高获取的目标对话语句的准确性。且本发明的技术方案,通过采用模型的方式获取目标对话语句,能够有效地提高对话的智能性以及对话效率。 | ||
搜索关键词: | 基于 人工智能 对话 方法 装置 计算机 可读 介质 | ||
接收用户的输入语句以及所述输入语句对应的上文语句;
根据所述输入语句,从预设的语料库中获取对应的多个候选对话语句;
根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型,为各所述候选对话语句打分;
根据所述多个候选对话语句的打分,从所述多个候选对话语句中获取目标对话语句,实现对话。
2.根据权利要求1所述的方法,其特征在于,根据所述输入语句,从预设的语料库中获取对应的多个候选对话语句,具体包括:根据所述输入语句,并结合所述上文语句,从所述语料库中获取同时与所述输入语句和所述上文语句对应的多个候选对话语句。
3.根据权利要求1所述的方法,其特征在于,根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型,为各所述候选对话语句打分,具体包括:对于各所述候选对话语句,将所述输入语句、所述上文语句以及对应的所述候选对话语句输入至所述分值预估模型,获取对应的所述候选对话语句的打分。
4.根据权利要求3所述的方法,其特征在于,根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型,为各所述候选对话语句打分之前,所述方法还包括:采集数组训练数据,各组所述训练数据中包括训练输入语句、训练上文语句以及多个训练对话语句,所述多个训练对话语句中包括正例对话语句和负例对话语句;
根据各组所述训练数据,训练所述分值预估模型,直到所述分值预估模型对应的目标函数收敛,确定所述分值预估模型的参数,从而确定所述分值预估模型。
5.根据权利要求1所述的方法,其特征在于,根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型,为各所述候选对话语句打分,具体包括:根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的字粒度的表达模型、词粒度的表达模型以及短语粒度的表达模型,分别获取所述输入语句、所述上文语句、以及各所述候选对话语句的字粒度表达、词粒度表达以及短语粒度表达;
根据所述输入语句和所述上文语句的字粒度表达、词粒度表达以及短语粒度表达,获取所述输入语句与所述上文语句之间的正向匹配表达以及反向匹配表达;
根据所述输入语句和各所述候选对话语句的字粒度表达、词粒度表达以及短语粒度表达,获取所述输入语句与各所述候选对话语句之间的正向匹配表达以及反向匹配表达;
根据所述输入语句与所述上文语句之间的正向匹配表达以及反向匹配表达、所述输入语句与各所述候选对话语句之间的正向匹配表达以及反向匹配表达以及预先训练的打分模型,获取各所述候选对话语句的打分。
6.根据权利要求5所述的方法,其特征在于,根据所述输入语句和所述上文语句的字粒度表达、词粒度表达以及短语粒度表达,获取所述输入语句与所述上文语句之间的正向匹配表达以及反向匹配表达,具体包括:根据所述输入语句和所述上文语句的字粒度表达、词粒度表达以及短语粒度表达,分别获取所述输入语句与所述上文语句之间的字粒度的正向相似度表达以及反向相似度表达、词粒度的正向相似度表达以及反向相似度表达、以及短语粒度的正向相似度表达以及反向相似度表达;
根据所述输入语句与所述上文语句之间的所述字粒度的正向相似度表达、所述词粒度的正向相似度表达以及所述短语粒度的正向相似度表达,获取所述输入语句与所述上文语句之间的所述正向匹配表达;
根据所述输入语句与所述上文语句之间的所述字粒度的反向相似度表达、所述词粒度的反向相似度表达以及所述短语粒度的反向相似度表达,获取所述输入语句与所述上文语句之间的所述反向匹配表达。
7.根据权利要求1‑6任一所述的方法,其特征在于,根据所述输入语句,从预设的语料库中获取对应的多个候选对话语句之前,所述方法还包括:获取人工方式采集的多组三元语料组,构成所述语料库;各所述三元语料组中包括预设上文语句、预设输入语句以及预设对话语句。
8.根据权利要求1‑6任一所述的方法,其特征在于,根据所述输入语句,从预设的语料库中获取对应的多个候选对话语句之前,所述方法还包括:采集数组候选三元语料组;
采用预先训练的上下文相关模型,从所述数组候选三元语料组中获取符合上下文相关性的多组三元语料组,构成所述语料库;
进一步地,采用预先训练的上下文相关模型,从所述数组候选三元语料组中获取符合上下文相关性的多组三元语料组之前,所述方法还包括:
获取人工采集的多组三元训练语料组,各所述三元训练语料组中包括人工标注的训练上文语句、训练输入语句、训练对话语句以及已知的上下文相关性的概率;
根据各组所述三元训练语料组,训练上下文相关识别模型。
9.一种基于人工智能的对话装置,其特征在于,所述装置包括:接收模块,用于接收用户的输入语句以及所述输入语句对应的上文语句;
获取模块,用于根据所述输入语句,从预设的语料库中获取对应的多个候选对话语句;
打分模块,用于根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的分值预估模型,为各所述候选对话语句打分;
所述获取模块,还用于根据所述多个候选对话语句的打分,从所述多个候选对话语句中获取目标对话语句,实现对话。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,具体用于根据所述输入语句,并结合所述上文语句,从所述语料库中获取同时与所述输入语句和所述上文语句对应的多个候选对话语句。11.根据权利要求9所述的装置,其特征在于,所述打分模块,具体用于对于各所述候选对话语句,将所述输入语句、所述上文语句以及对应的所述候选对话语句输入至所述分值预估模型,获取对应的所述候选对话语句的打分。12.根据权利要求11所述的装置,其特征在于,所述装置还包括:采集模块,用于采集数组训练数据,各组所述训练数据中包括训练输入语句、训练上文语句以及多个训练对话语句,所述多个训练对话语句中包括正例对话语句和负例对话语句;
训练模块,用于根据各组所述训练数据,训练所述分值预估模型,直到所述分值预估模型对应的目标函数收敛,确定所述分值预估模型的参数,从而确定所述分值预估模型。
13.根据权利要求9所述的装置,其特征在于,所述打分模块,具体用于:根据所述输入语句、所述上文语句、各所述候选对话语句以及预先训练的字粒度的表达模型、词粒度的表达模型以及短语粒度的表达模型,分别获取所述输入语句、所述上文语句、以及各所述候选对话语句的字粒度表达、词粒度表达以及短语粒度表达
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711390831.4/,转载请声明来源钻瓜专利网。