[发明专利]一种标签的标记方法、装置、服务器和存储介质有效
| 申请号: | 201811229982.6 | 申请日: | 2018-10-22 |
| 公开(公告)号: | CN109547863B | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 徐乐乐 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
| 主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/8352;G06F16/35 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 430070 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 标签 标记 方法 装置 服务器 存储 介质 | ||
1.一种标签的标记方法,其特征在于,包括:
从直播类别中的直播间提取多个类型的文本信息;
从所述文本信息中提取特征词;
根据所述特征词与所述直播类别之间的关联性从所述特征词中筛选候选词;
根据所述文本信息对应的类型从所述候选词中筛选目标词;
将所述目标词设置为所述直播类别的标签信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述特征词与所述直播类别之间的关联性从所述特征词中筛选候选词,包括:
基于所述特征词与所述直播类别之间的分布差异计算所述特征词的期望值,其中,所述期望值与所述分布差异正相关;
按照所述期望值从所述特征词中筛选候选词。
3.根据权利要求2所述的方法,其特征在于,通过如下公式计算所述特征词的期望值
其中,N为所述文本信息的数量,A表示在直播类别v中出现特征词w的次数,B表示在非直播类别v中出现特征词w的次数,C表示在直播类别v中出现非特征词w的次数,D表示在非直播类别v中出现非特征词w的次数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述文本信息对应的类型从所述候选词中筛选目标词,包括:
计算所述候选词在所述类型中的分类评分值;
结合所述分类评分值计算所述候选词的综合评分值;
按照所述综合评分值从所述候选词中筛选目标词。
5.根据权利要求4所述的方法,其特征在于,所述计算所述候选词在所述类型中的分类评分值,包括:
统计所述候选词在所述类型中出现的总次数;
按照所述总次数计算所述候选词在所述类型中的分类评分值,其中,所述总次数与所述分类评分值正相关。
6.根据权利要求4所述的方法,其特征在于,所述结合所述分类评分值计算所述候选词的综合评分值,包括:
按照所述类型对所述分类评分值配置权重,获得调权评分值;
计算所述调权评分值之和,作为所述候选词的综合评分值。
7.根据权利要求4所述的方法,其特征在于,所述文本信息的类型包括如下至少一种:
所述直播间的标题、所述直播间的弹幕、子分类名称;
其中,所述子分类名称为所述直播间在所述直播类别下归属的直播子分类的名称;
通过如下公式计算所述候选词w的综合评分值R(w):
R(w)=λ1*log(tf_text(w)+1)+λ2*log(tf_t(w)+1)+λ3*log(tf_zone(w)+1)
其中,tf_text(w)为候选词w在所述直播间的标题、所述直播间的弹幕与子分类名称中出现的总次数,tf_t(w)为候选词w在所述直播间的标题中出现的总次数,tf_zone(w)为候选词w在子分类名称中出现的总次数,λ1、λ2、λ3为权重。
8.一种标签的标记装置,其特征在于,包括:
文本信息提取模块,用于从直播类别中的直播间提取多个类型的文本信息;
特征词提取模块,用于从所述文本信息中提取特征词;
候选词筛选模块,用于根据所述特征词与所述直播类别之间的关联性从所述特征词中筛选候选词;
目标词筛选模块,用于根据所述文本信息对应的类型从所述候选词中筛选目标词;
标签信息设置模块,用于将所述目标词设置为所述直播类别的标签信息。
9.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的标签的标记方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的标签的标记方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811229982.6/1.html,转载请声明来源钻瓜专利网。





