[发明专利]一种多轮对话装置及方法在审
| 申请号: | 202110958910.0 | 申请日: | 2021-08-20 |
| 公开(公告)号: | CN113672714A | 公开(公告)日: | 2021-11-19 |
| 发明(设计)人: | 曾祥云;朱姬渊 | 申请(专利权)人: | 上海大参林医疗健康科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/194;G06F40/30 |
| 代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 杨松城 |
| 地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 轮对 装置 方法 | ||
1.一种多轮对话装置,其特征是,包括数据处理模块、表征模块、特征抽取模块、问答特征相似度模块,目标函数模块,其中:
数据处理模块用以将历史聊天的多轮对话数据进行解析,得到输入数据:上文对话文本数据、问题数据以及答案数据;
表征模块用以对输入数据进行映射,得到句向量集;
特征抽取模块用以对句向量集进行分析,得到上文特征向量、问题特征向量以及答案特征向量;
问答特征相似度模块用以对所述上文特征向量、问题特征向量以及答案特征向量进行处理,得到评分矩阵;
目标函数模块用以根据评分矩阵,设置合适多轮对话装置的目标函数。
2.如权利要求1所述的多轮对话装置,其特征是,所述表征模块对输入数据进行映射包括:
对上文对话文本数据、问题数据以及答案数据的每个句子进行分字;
将每个字的位置用ID表示;
把每个ID用N维的随机向量表示;
得到句向量集。
3.如权利要求1所述的多轮对话装置,其特征是,问答特征相似度模块用以把所述特征向量进行处理,得到评分矩阵包括:
将上文特征向量和问题特征向量进行拼接求和;
将答案特征向量和拼接后得到的特征进行矩阵相乘得到评分矩阵。
4.如权利要求1所述的多轮对话装置,其特征是,目标函数模块使用softmax作为激活函数、损失函数为交叉熵进行求导获得目标函数。
5.如权利要求1所述的多轮对话装置,其特征是,特征抽取模块为由若干个双编码器模块堆叠而成,其中,每个双编码器模块的结构为依次连接的自注意力层、归一化层、前馈神经网络层以及归一化层。
6.如权利要求5所述的多轮对话装置,其特征是,所述归一化层为输出向量经过残差连接与输入向量相加残差连接之后再进行归一化处理。
7.一种多轮对话方法,应用于多轮对话装置,包括:
将用户当前输入的声音转换为自然语言文本;
结合历史对话状态和当前的自然语言文本输入多轮对话装置;
多轮对话装置根据历史对话状态和当前的自然语言文本预测当前对话状态;
根据当前对话状态输出对应的系统行为;
将所述系统行为转换为自然语言文本或语音,形成一轮对话;
等待下一轮用户输入的声音进行下一轮对话;
其特征在于,所述的多轮对话装置为权利要求1-6中任一项所述的多轮对话装置。
8.一种多轮对话方法,应用于多轮对话装置,包括:
接收当前用户输入的自然语言文本;
结合历史对话状态和当前的自然语言文本信息输入多轮对话装置;
多轮对话装置根据历史对话状态和当前的自然语言文本预测当前对话状态;
根据当前对话状态输出对应的系统行为;
将所述系统行为转换为自然语言文本或语音,形成一轮对话;
等待下一轮用户输入的自然语言文本进行下一轮对话;
其特征在于,所述的多轮对话装置为权利要求1-6中任一项所述的多轮对话装置。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求7或8所述的方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求7或8所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大参林医疗健康科技有限公司,未经上海大参林医疗健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110958910.0/1.html,转载请声明来源钻瓜专利网。





