[发明专利]一种弹幕关键词筛选的方法、装置、设备及存储介质在审
申请号: | 201810829527.3 | 申请日: | 2018-07-25 |
公开(公告)号: | CN109145291A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 张祥;马逢伯;刘静;仇贲 | 申请(专利权)人: | 广州虎牙信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;H04N21/435;H04N21/4788 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 511400 广东省广州市番禺区南村镇万博二*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种弹幕关键词筛选的方法、装置、设备及存储介质。该方法包括:构造与多个主播相关的弹幕文档集,并选择符合第一预设条件的主播对应的弹幕文档作为待评价文档;根据备选词在对应待评价文档中的第一出现频率,以及所述弹幕文档集中包括所述备选词的弹幕文档数量,确定与各所述备选词分别对应的关键性权重;根据所述关键性权重,在各所述待评价文档的弹幕词中筛选出对应的关键词。通过上述方法解决需要人工阅读大量弹幕内容、客服人员主观选择优质弹幕内容的问题,实现在排除场景化的常规词语之后,选择出代表弹幕核心内容的词语。 | ||
搜索关键词: | 文档 关键词筛选 存储介质 权重 词语 核心内容 预设条件 主观选择 场景化 文档集 客服 筛选 阅读 | ||
【主权项】:
1.一种弹幕关键词筛选的方法,其特征在于,包括:构造与多个主播相关的弹幕文档集,并选择符合第一预设条件的主播对应的弹幕文档作为待评价文档;其中,弹幕文档集由多个弹幕文档组成,弹幕文档中包括多个弹幕词;根据备选词在对应待评价文档中的第一出现频率,以及所述弹幕文档集中包括所述备选词的弹幕文档数量,确定与各所述备选词分别对应的关键性权重;其中,所述弹幕文档集的数量与弹幕文档集中包括所述备选词的弹幕文档数量的比值记为第二出现频率;根据所述关键性权重,在各所述待评价文档的弹幕词中筛选出对应的关键词;其中,所述关键词权重与所述第一出现频率成正比,与所述第二出现频率成反比。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙信息科技有限公司,未经广州虎牙信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810829527.3/,转载请声明来源钻瓜专利网。