[发明专利]文本推荐方法、装置、设备及介质在审
申请号: | 202111649278.8 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114297501A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 鄢秋霞;李昱;张圳;李斌;安飞飞 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/279;G06F40/284;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘丹;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 推荐 方法 装置 设备 介质 | ||
本申请提供一种文本推荐方法、装置、设备及介质,涉及自然语言处理技术领域,通过获取多个文本中每一文本的文本特征;根据所述每一文本的文本特征,确定所述每一文本的特征向量,并根据所述每一文本的特征向量生成所述多个文本的特征矩阵;根据所述多个文本的特征矩阵,确定所述多个文本的子特征矩阵,并根据所述多个文本的子特征矩阵确定所述多个文本之间的相似度信息;其中,所述子特征矩阵的数量为至少两个;根据所述相似度信息,确定预设文本库中的文本中的待推荐文本,并向用户推荐所述待推荐文本。采用本技术方案,能够准确且快速地向用户推荐相似的文本。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种文本推荐方法、装置、设备及介质。
背景技术
目前,网上的数据信息比较繁杂,用户在查看需要的数据信息时需要阅读大量的无用的数据信息。因此,如何为用户推荐与用户兴趣偏好相似的资讯信息是大众比较关注的问题。
目前为用户推荐相似内容的方法中,所使用的内容推荐算法的计算量比较大,因此,亟需一种文本推荐的方法,能够准确且快速地向用户推荐相似的文本。
发明内容
本申请提供一种文本推荐方法、装置、设备及介质,能够准确且快速地向用户推荐相似的文本。
第一方面,本申请提供一种文本推荐方法,所述方法包括:
获取多个文本中每一文本的文本特征;
根据所述每一文本的文本特征,确定所述每一文本的特征向量,并根据所述每一文本的特征向量生成所述多个文本的特征矩阵;
根据所述多个文本的特征矩阵,确定所述多个文本的子特征矩阵,并根据所述多个文本的子特征矩阵确定所述多个文本之间的相似度信息;其中,所述子特征矩阵的数量为至少两个;
根据所述相似度信息,确定预设文本库中的文本中的待推荐文本,并向用户推荐所述待推荐文本。
在一个示例中,根据所述多个文本的特征矩阵,确定所述多个文本的子特征矩阵,包括:
根据所述多个文本的特征矩阵,确定所述特征矩阵的转置矩阵;
根据所述多个文本的特征矩阵,确定所述特征矩阵的子特征矩阵;
根据所述多个文本的所述特征矩阵的转置矩阵,确定所述特征矩阵的转置矩阵的子特征矩阵;
将所述特征矩阵的子特征矩阵和所述特征矩阵的转置矩阵的子特征矩阵作为所述多个文本的子特征矩阵。
在一个示例中,根据所述多个文本的子特征矩阵确定所述多个文本之间的相似度信息,包括:
根据所述特征矩阵的每一文本的每一子特征矩阵和所述特征矩阵的转置矩阵的每一文本的每一子特征矩阵确定两者之间的第一余弦相似度信息;
根据所述第一余弦相似度信息确定所述多个文本之间的第二余弦相似度信息;
根据所述第二余弦相似度信息确定所述多个文本之间的相似度信息。
在一个示例中,所述文本特征包括文本内容和文本标签,所述文本标签表征文本的特征属性;若所述文本特征为文本内容,根据所述每一文本的文本特征,确定所述每一文本的特征向量,包括:
获取所述每一文本的文本内容中的词语信息;
根据所述词语信息,确定所述词语信息的词向量;其中,所述词向量表征所述词语信息的语义信息;
根据所述词向量,确定所述每一文本的中心向量,将所述每一文本的中心向量作为所述每一文本的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111649278.8/2.html,转载请声明来源钻瓜专利网。