[发明专利]对话文本的处理方法、装置、电子设备及存储介质在审
| 申请号: | 202010832715.9 | 申请日: | 2020-08-18 |
| 公开(公告)号: | CN111967224A | 公开(公告)日: | 2020-11-20 |
| 发明(设计)人: | 陶健 | 申请(专利权)人: | 深圳市欢太科技有限公司;OPPO广东移动通信有限公司 |
| 主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/30;G06F16/332;G06F16/33;G06K9/62 |
| 代理公司: | 广州德科知识产权代理有限公司 44381 | 代理人: | 万振雄;林翠 |
| 地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对话 文本 处理 方法 装置 电子设备 存储 介质 | ||
1.一种对话文本的处理方法,其特征在于,包括:
获取第一文本序列,所述第一文本序列至少包括最近一轮对话的对话文本;
通过文本处理模型获取所述第一文本序列的文本特征,并根据所述文本特征得到第二文本序列,所述第二文本序列为所述最近一轮对话的对话文本对应的指代消解文本,
其中,所述文本特征包括第一自注意力特征及第二自注意力特征,所述文本处理模型包括编码器及解码器,所述编码器用于获取所述第一文本序列的所述第一自注意力特征,所述解码器用于根据所述第一自注意力特征获取所述第二自注意力特征,所述编码器及解码器均为通过基于自注意力机制的自然语言处理模型进行预训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述获取第一文本序列,包括:
获取原始文本,并根据所述原始文本生成第一文本序列,所述原始文本包括最近一轮对话的对话文本,以及在所述最近一轮对话之前的N轮对话文本,所述N为自然数。
3.根据权利要求2所述的方法,其特征在于,所述文本处理模型还包括指针网络模型,所述根据所述文本特征得到第二文本序列,包括:
通过所述指针网络模型分析所述第一自注意力特征及第二自注意力特征,并输出位置坐标;
在所述原始文本中查找与所述位置坐标匹配的字符,并根据查找到的字符得到第二文本序列。
4.根据权利要求3所述的方法,其特征在于,所述通过所述指针网络模型分析所述第一自注意力特征及第二自注意力特征,并输出位置坐标,包括:
将所述第一自注意力特征及本次所述解码器输出的第二自注意力特征输入所述指针网络模型;
通过所述指针网络模型分析所述第一自注意力特征及本次的第二自注意力特征,并输出本次得到的位置坐标;
所述在所述原始文本中查找与所述位置坐标匹配的字符,并根据查找到的字符得到第二文本序列,包括:
在所述原始文本中查找与所述本次得到的位置坐标匹配的字符;
将查找到的字符拼接到上一次的中间文本序列,得到本次的中间文本序列,并将所述本次的中间文本序列作为下一次所述解码器的输入,以通过所述解码器输出下一次的第二自注意力特征;
当所述指针网络模型输出终止符时,将上一次得到的中间文本序列作为第二文本序列输出。
5.根据权利要求2至4任一所述的方法,其特征在于,所述文本特征还包括所述第一文本序列中各个字符的轮数特征;
在所述获取原始文本之后,所述方法还包括:
在所述原始文本包含的各个字符中,添加对应的轮数特征,所述轮数特征用于表征字符在所述原始文本中对应的对话轮数。
6.根据权利要求2至4任一所述的方法,其特征在于,所述文本特征还包括所述第一文本序列中各个字符的位置信息;
在获取最获取原始文本之后,所述方法还包括:
针对所述原始文本包含的各个字符,分别标注位置信息,所述位置信息用于表征字符在所属的对话文本中的位置。
7.根据权利要求2所述的方法,其特征在于,所述根据所述原始文本生成第一文本序列,包括:
识别所述原始文本中包含的第一类型的字符;
删除所述原始文本中的所述第一类型的字符,得到第一文本序列,
或将所述原始文本中的所述第一类型的字符替换为目标字符,得到第一文本序列。
8.根据权利要求1至4任一所述的方法,其特征在于,所述通过文本处理模型获取所述第一文本序列的文本特征,包括:
获取所述第一文本序列中各个字符的嵌入向量;
将所述各个字符的嵌入向量输入编码器,并通过所述编码器对所述各个字符的嵌入向量进行归一化处理;
根据归一化处理后的嵌入向量,分别计算所述第一文本序列中各个字符的自注意力,并根据计算得到的自注意力生成第一自注意力特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市欢太科技有限公司;OPPO广东移动通信有限公司,未经深圳市欢太科技有限公司;OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010832715.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种塑料管材扩孔装置
- 下一篇:一种大姿态四元数全角域转换欧拉角方法





