[发明专利]一种相似信息推荐方法、装置、设备及存储介质有效
申请号: | 201810731844.1 | 申请日: | 2018-07-05 |
公开(公告)号: | CN109241268B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 林芬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允;肖丁 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似 信息 推荐 方法 装置 设备 存储 介质 | ||
本发明公开了一种相似信息推荐方法、装置、设备及存储介质,所述方法包括:获取自然对话数据集和信息相似度数据集;根据所述自然对话数据集和信息相似度数据集建立相似信息判别模型;获取用户输入信息;将所述用户输入信息传入所述相似信息判别模型中,得到与所述用户输入信息对应的相似信。本发明利用自然对话数据集作为训练数据,能够在具有较少信息相似度数据集的情况下保证训练出良好的相似信息判别模型,提升信息推荐的质量。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种相似信息推荐方法、装置、设备及存储介质。
背景技术
现有的计算问题相似度的技术,主要通过收集问题相似度数据,然后通过最大化该数据集的似然概率,训练问题相似度判别模型,该模型的输入是问题1和问题2,输出是两个问题的相似度;最后根据用户提出的问题,与问题库中的每一个问题都计算出相似度,为用户推荐相似度较高的问题。
通常问题相似度数据的采集过程需要人工标注,而人工标注则十分昂贵且费时,无法产生大量的问题相似度数据,导致训练模型使用的数据量较少,训练出的问题判别模型不佳。
因此,需要提供一种通过简单有效的方式训练出良好问题判别模型的技术方案。
发明内容
为了解决现有技术中的问题,本发明提供了一种相似信息推荐方法、装置、设备及存储介质,具体地:
一方面提供了一种相似信息推荐方法,所述方法包括:
获取自然对话数据集和信息相似度数据集;
根据所述自然对话数据集和信息相似度数据集建立相似信息判别模型;
获取用户输入信息;
将所述用户输入信息传入所述相似信息判别模型中,得到与所述用户输入信息对应的相似信息。
所述自然对话数据集包括多组对话流;每组对话流均包括一个或多个由连续对话形式的数据组成的对话语句;
所述信息相似度数据集包括多个三元组;每个三元组均包括一个语句对以及所述语句对对应的相似度,每个语句对均包括两个相似语句。
另一方面提供了一种相似信息推荐装置,所述装置包括:
数据集获取模块,用于获取自然对话数据集和信息相似度数据集;
判别模型建立模块,用于根据所述自然对话数据集和信息相似度数据集建立相似信息判别模型;
输入信息获取模块,用于获取用户输入信息;
相似信息得到模块,用于将所述用户输入信息传入所述相似信息判别模型中,得到与所述用户输入信息对应的相似信息。
进一步地,所述相似信息得到模块包括:
第三句向量获取单元,用于利用所述第一神经网络模型参数中的词向量参数和编码层参数,将所述用户输入信息进行句向量表示,得到第三句向量;
第四句向量获取单元,用于利用所述第一神经网络模型参数中的词向量参数和编码层参数,将所述信息相似度数据集所在信息库中的所有相似语句进行句向量表示,得到多个第四句向量;
语句相似度获取单元,用于根据所述第二神经网络模型参数中的张量网络层参数和分类网络层参数,得到每个第四句向量的相似语句与所述第三句向量的输入语句的语句相似度;
语句相似度确定单元,用于将得到的语句相似度与预设相似度进行比较,获得大于所述预设相似度的语句相似度;
相似信息确定单元,用于根据大于所述预设相似度的语句相似度匹配出对应的第四句向量,并根据所述第四句向量确定出与所述用户输入信息对应的相似语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810731844.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置