[发明专利]一种确定内容互动平台标签的方法、装置及可读存储介质有效
申请号: | 201910703586.0 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110442767B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/335;G06F16/33;G06F40/289 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 内容 互动 平台 标签 方法 装置 可读 存储 介质 | ||
本申请涉及计算机技术领域,提供了一种确定内容互动平台标签的方法、装置及可读存储介质,该方法包括:获取内容互动平台的文本集合;分别对所述文本集合中的各个文本进行分词处理,获得分词集合;将所述分词集合输入至词向量模型,获得词向量集合;将所述词向量集合输入至神经网络模型,获得所述词向量集合中每个词向量的条件概率;其中,所述条件概率用于表示该词向量与其它词向量的相关度;将各个词向量集合中条件概率满足预设条件的词向量对应的分词确定为所述内容互动平台的标签。本申请实施例中通过对内容互动平台的文本集合进行词向量模型以及神经网络模型的联合处理,提高了标签与内容互动平台中的内容的匹配度。
技术领域
本申请涉及计算机技术领域,尤其涉及一种确定内容互动平台标签的方法、装置及可读存储介质。
背景技术
随着自媒体的不断发展,出现各种类型的内容互动平台。为了便于用户查找相应的内容互动平台,可以为各个内容互动平台标注标签。
目前,确定各个内容互动平台的标签的方式一般是先人工标注各个样本的标签,通过机器学习内容分类方法给公众号打标签,但是这种打标签的方式容易出现过拟合情况,导致确定出的标签较为单一,很难与内容互动平台的内容相契合。
发明内容
本申请实施例提供一种确定内容互动平台的标签方法、装置及可读存储介质,用于提高内容互动平台的标签和内容互动平台的内容的匹配度。
第一方面,提供一种确定内容互动平台标签的方法,包括:
获取内容互动平台的文本集合;
分别对所述文本集合中的各个文本进行分词处理,获得分词集合;
将所述分词集合输入至词向量模型,获得词向量集合;
将所述词向量集合输入至神经网络模型,获得所述词向量集合中每个词向量的条件概率;其中,所述条件概率用于表示该词向量与其它词向量的相关度;
将各个词向量集合中条件概率满足预设条件的词向量对应的分词确定为所述内容互动平台的标签。
在一种可能的实施方式中,将所述文本集合输入词向量模型,获取词向量集合,包括:
通过所述词向量模型的编码操作,得到所述文本集合中各个分词对应的词向量;
通过所述词向量模型的拼接处理,将各个分词对应的词向量拼接处理为词向量组合,获得各个词向量组合组成的所述词向量集合。
在一种可能的实施方式中,将所述词向量集合输入至神经网络模型,获得所述词向量集合中每个词向量的条件概率,包括:
将所述词向量集合输入至神经网络模型,通过预设矩阵对所述词向量进行映射处理,获得映射后的词向量集合;
确定所述映射后的词向量集合中每个词向量出现时,该所述词向量集合中其它词向量中每个词向量出现的概率;
将所述词向量集合中其它词向量中每个词向量出现的概率相乘,获得该词向量的条件概率,获得所述词向量集合中每个词向量对应的条件概率。
在一种可能的实施方式中,在获得所述词向量集合中每个词向量对应的条件概率之后,包括:
根据所述词向量集合中与每个词向量的条件概率,确定所述神经网络模型对应的损失函数值;
根据损失函数值,调整所述神经网络模型中的参数;其中,所述参数包括所述预设矩阵中的元素;
直到所述损失函数值满足预设范围,更新所述神经网络模型的参数。
在一种可能的实施方式中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910703586.0/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法