[发明专利]一种多轮对话智能语音交互系统及装置有效
申请号: | 201910505280.4 | 申请日: | 2019-06-12 |
公开(公告)号: | CN110209791B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 张韶峰;冯鑫;王世朋 | 申请(专利权)人: | 百融云创科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35 |
代理公司: | 北京立成智业专利代理事务所(普通合伙) 11310 | 代理人: | 张江涵 |
地址: | 100043 北京市石景*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轮对 智能 语音 交互 系统 装置 | ||
1.一种多轮对话智能语音交互系统,其特征是包括混合式语义理解模块、语义理解自适应模块和自动对话管理模块,语音输入经语音识别后转化为文本输入混合式语义理解模块,理解用户意图与提取相应状态信息,自动对话管理模块基于用户意图,引导对话过程,输出对话文本并转换为语音输出,实现对话,语义理解自适应模块用于混合式语义理解模块的优化学习;
混合式语义理解模块,采用模型融合的方式,结合文本匹配、语义相似度匹配、信息检索、多意图分类模型等语义理解方案,综合判别对话语义,其中文本匹配属于前置算法,先对语句进行预处理,得到预处理的对话文本,再由语义相似度匹配、信息检索和多意图分类模型融合的方式,共同输出最终结果;其中,文本匹配用于建立语义理解规则,语义相似度匹配采用基于注意力机制的Bi-LSTM神经网络语言模型建立语义匹配模型,将输入的对话文本结合语义理解规则进行向量化表示,并采用训练孪生网络的方式,对语义匹配模型进行精调fine-tune,最后基于向量化表示训练卷积神经网络的回归模型,来预测两个文本间的语义相似度;信息检索通过对话文本对应的标准语料数据库及标准语料的意图类别,基于语义相似度从标准语料库中检索出与对话文本语义相似度最高的一条语料,将其意图类别作为对话文本的意图分类,实现识别输入文本的意图;多意图分类模型结合标准语料数据和应用场合的业务数据,生成多意图类别的标注数据,训练一个基于注意力机制的Bi-LSTM网络作为多意图分类模型,进行多分类预测,提供标准语料的意图类别;
语义理解自适应模块,通过迁移学习、重新训练的方式,优化已有的混合式语义理解模型,包括Bi-LSTM语义匹配模型、相似度匹配模型与多意图分类模型,包括以下优化:
1)将新增的语料数据导入Bi-LSTM语义匹配模型的训练数据中,进行训练,更新其网络权重;
2)对多意图分类模型的新增标注数据进行清洗过滤,筛选出最优的一部分标注数据,混入标准语料库中,并对全部标注数据进行重新意图预测,根据语料的文本特征与其在标注数据集上的表现,建立有监督的排序模型以及相应的指标监控机制,监控各意图识别的准确率与召回率和标注语料库的语料变化;
3)将新增标注数据导入Bi-LSTM多意图分类模型,更新其网络权重,并监控其在验证集上的准确率与召回率;
4)自动化部署上线更新后的混合式语义理解模块中的模型,以及标准语料库;
自动对话管理模块,用于实现人机交互控制与拓展配置,基于当前对话所处的状态、识别的当前的用户意图与历史对话交互的信息,综合判别输出的交互指令;并且通过多意图识别,通过一次人机对话,实现多次交互与状态转换。
2.根据权利要求1所述的一种多轮对话智能语音交互系统,其特征是自动对话管理模块采用有限状态机与强化学习相结合的方式,在执行每一轮对话交互时,将当前对话所处的状态、当前的用户意图与历史交互的信息,结合预先设定的对话交互规则与通过学习得到的交互策略,进行综合判断,输出对话机器人应执行的交互操作指令。
3.一种多轮对话智能语音交互装置,其特征是所述装置为具有存储介质的计算机装置,所述存储介质中装载有计算机程序,所述计算机程序用于实现权利要求1或2所述的多轮对话智能语音交互系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百融云创科技股份有限公司,未经百融云创科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910505280.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:问答匹配方法和装置
- 下一篇:对话彩蛋生成方法及系统