[发明专利]数据处理方法、装置和电子设备在审
| 申请号: | 202111321833.4 | 申请日: | 2021-11-09 |
| 公开(公告)号: | CN116108852A | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 王鹏 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/332;G06N3/0455;G06N3/08 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张文华 |
| 地址: | 510530 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 | ||
本申请公开了一种数据处理方法、装置和电子设备。其中,该方法包括:获取原问题;将所述原问题输入到神经网络模型中,并利用所述神经网络模型确定所述原问题的第一长度和与所述原问题具有语义相关性的问题集合,其中,所述问题集合中的问题长度为对所述第一长度进行不同的长度调整得到的;依据所述神经网络模型对应的受限条件对所述问题集合中的词进行修改,得到目标问题,其中,所述原问题与所述目标问题为相似问题,且所述原问题与所述目标问题对应同一答案。本申请解决了通过Beam Search方法获取多个相似性问题存在多样性不足,导致对智能客服系统的整体性能提升有限的技术问题。
技术领域
本申请涉及神经网络领域,具体而言,涉及一种数据处理方法、装置和电子设备。
背景技术
智能客服系统知识库中所包含的一种重要的知识形式是“问题-答案”对,知识库运维人员通过手工录入的方式把这种形式的知识录入智能客服知识库中;当有用户向智能客服提问和知识库中问题比较相似的问题时,智能客服就会返回相应的答案给用户。由于同一个问题可以有不同的表述方法,这种自然语言说具有的天然表述多样性给模型检索算法提出了挑战。所以智能客服系统为了提升检索准确率,会要求知识库运维人员录入当前问题的其他相似问题。而知识库运维人员在录入其他相似问题的时,要求各个问题语义一致,同时用词更多样性,这也给知识库运维人员提出了更大的挑战。
“多样性相似问题生成”是语言生成的一部分,基于神经网络Seq2Seq是做语言生成任务竟然用到的一种网络结构,通常做法可以通过Beam Search的方法获取多个生成的句子(即相似问题),但是通过Beam Search方法获得的结果往往多样性不足,从而对知识库运维人员的辅助以及对系统整体性能的提升有限。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种数据处理方法、装置和电子设备,以至少解决通过BeamSearch方法获取多个相似性问题存在多样性不足,导致对智能客服系统的整体性能提升有限的技术问题。
根据本申请实施例的一个方面,提供了一种数据处理方法,包括:获取原问题;将原问题输入到神经网络模型中,并利用神经网络模型确定原问题的第一长度和与原问题具有语义相关性的问题集合,其中,问题集合中的问题长度为对第一长度进行不同的长度调整得到的;依据神经网络模型对应的受限条件对问题集合中的词进行修改,得到目标问题,其中,原问题与目标问题为相似问题,且原问题与目标问题对应同一答案。
可选地,神经网络模型包括编码器和解码器,将原问题输入到神经网络模型中,包括:将原问题输入到编码器中进行编码,得到原问题中每个词对应的编码向量,以及得到原问题对应的语义向量。
可选地,利用神经网络模型确定原问题的第一长度之后,方法还包括:将问题长度、编码向量以及语义向量输入到解码器中,通过解码器得到与原问题相似的目标问题。
可选地,在将问题长度、编码向量以及语义向量输入到解码器之前,方法还包括:将问题长度与语义向量做乘积计算后,再将乘积计算后的结果和编码向量输入到解码器中进行解码。
可选地,神经网络模型包括编码器和解码器,将原问题输入到神经网络模型中,包括:将原问题输入到编码器中进行位置编码,得到原问题中每个词的位置向量。
可选地,在得到原问题中每个词的位置向量之后,方法还包括:将原问题中每个词的位置向量输入到解码器中,根据问题长度更新位置向量。
可选地,依据神经网络模型对应的受限条件对问题集合中的词进行修改,包括:问题集合中的词为解码器输出的词,修改从解码器中随机选取的输出的词的概率。
可选地,修改从解码器中随机选取的输出的词的概率,包括:将从解码器中随机选取的输出的词的概率置为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111321833.4/2.html,转载请声明来源钻瓜专利网。





