[发明专利]一种相似信息推荐方法、装置、设备及存储介质有效
申请号: | 201810731844.1 | 申请日: | 2018-07-05 |
公开(公告)号: | CN109241268B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 林芬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允;肖丁 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似 信息 推荐 方法 装置 设备 存储 介质 | ||
1.一种相似信息推荐方法,其特征在于,所述方法包括:
获取自然对话数据集和信息相似度数据集;
利用所述自然对话数据集训练第一神经网络模型,得到所述第一神经网络模型的参数;
根据训练好的第一神经网络模型,对所述信息相似度数据集中的相似语句进行句向量表示,得到多个第二句向量;
利用所述第二句向量训练第二神经网络模型,得到所述第二神经网络模型的参数;
根据所述第一神经网络模型的参数和所述第二神经网络模型的参数,结合得到相似信息判别模型;
获取用户输入信息;
将所述用户输入信息传入所述相似信息判别模型中,得到与所述用户输入信息对应的相似信息。
2.根据权利要求1所述的相似信息推荐方法,其特征在于,所述利用所述自然对话数据集训练第一神经网络模型,得到所述第一神经网络模型的参数,包括:
利用所述自然对话数据集中的第一对话流训练第一神经网络模型,得到所述第一对话流中多个对话语句的第一词语集合概率;
将所述自然对话数据集中的第二对话流作为第一对话流,根据得到所述第一词语集合概率的方式,获得所述第二对话流中多个对话语句的第二词语集合概率;
依次遍历所述自然对话数据集中其他的对话流,分别得到对应的词语集合概率;
根据所有的词语集合概率得到第一目标函数;
对所述第一目标函数进行最大化处理,确定出所述第一神经网络模型的参数;所述第一神经网络模型的参数包括词向量参数、编码层参数、解码层参数。
3.根据权利要求2所述的相似信息推荐方法,其特征在于,所述利用所述自然对话数据集中的第一对话流训练第一神经网络模型,得到所述第一对话流中多个对话语句的第一词语集合概率,包括:
设定第一数量p,将所述第一对话流中第p+1个对话语句作为第一目标语句;
将所述第一目标语句的前k个对话语句和后k个对话语句输入所述第一神经网络模型中,k小于等于第一数量p;
根据所述前k个对话语句和后k个对话语句,得到所述第一目标语句对应的第一上下文向量;
根据所述第一上下文向量对所述第一目标语句中的词语进行预测,得到第一词语组合概率;
将第p+2个对话语句作为第p+1个对话语句,根据得到第一词语组合概率的方式获得第p+2个对话语句对应的第二词语组合概率;
依次遍历至倒数第p-1个语句,得出第p+1个对话语句到倒数第p-1个对话语句分别对应的词语组合概率;
由第p+1个对话语句到倒数第p-1个对话语句对应的词语组合概率,得到所述第一词语集合概率。
4.根据权利要求3所述的相似信息推荐方法,其特征在于,所述根据所述前k个对话语句和后k个对话语句,得到所述第一目标语句对应的第一上下文向量;包括:
根据所述第一神经网络模型的编码层,对所述前k个对话语句和后k个对话语句进行句向量表示,得到2k个第一句向量;
将所述2k个第一句向量进行加权处理,得到所述第一目标语句对应的第一上下文向量。
5.根据权利要求3所述的相似信息推荐方法,其特征在于,所述根据所述第一上下文向量对所述第一目标语句进行预测,得到第一词语组合概率,包括:
将所述第一目标语句的第一词语输入所述第一神经网络模型的解码层,使所述第一上下文向量对所述第一词语进行预测,得到所述第一词语的概率;
将第二词语作为第一词语,根据得到所述第一词语的概率的方式获得所述第二词语的概率;
依次遍历所述第一目标语句中其他词语的概率,得到所述第一词语组合概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810731844.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置