[发明专利]直播间处理方法及装置、电子设备、存储介质在审
| 申请号: | 201910646605.0 | 申请日: | 2019-07-17 |
| 公开(公告)号: | CN110377843A | 公开(公告)日: | 2019-10-25 |
| 发明(设计)人: | 邓贤 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/33 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
| 地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 直播 目标文本 相似度 分词 存储介质 电子设备 文本向量 文本 标题信息 网络直播 全面性 热门 | ||
1.一种直播间处理方法,其特征在于,包括:
获取直播间的目标文本,所述目标文本包括标题信息和/或弹幕信息;
对所述直播间的所述目标文本进行分词得到分词后的文本,并根据所述分词后的文本确定所述直播间的文本向量;
根据两个所述直播间的文本向量计算两个所述直播间之间的相似度,以便于根据所述相似度进行直播间处理。
2.根据权利要求1所述的直播间处理方法,其特征在于,获取直播间的目标文本包括:
在预设时间周期内,按照所述标题信息和/或所述弹幕信息的生成时间获取所述直播间的所述目标文本。
3.根据权利要求1所述的直播间处理方法,其特征在于,对所述直播间的所述目标文本进行分词得到分词后的文本包括:
构建直播词汇词典,所述直播词汇词典用于存储与直播间相关的词汇;
根据所述直播词汇词典对所述目标文本进行分词,以得到分词后的文本。
4.根据权利要求1所述的直播间处理方法,其特征在于,根据所述分词后的文本确定所述直播间的文本向量包括:
提取各所述分词后的文本的词向量,并根据所述词向量确定所述直播间的所述文本向量。
5.根据权利要求4所述的直播间处理方法,其特征在于,提取各所述分词后的文本的词向量包括:
将各所述分词后的文本输入word2vec模型进行训练,以提取各所述分词的所述词向量。
6.根据权利要求4所述的直播间处理方法,其特征在于,根据所述词向量确定所述直播间的所述文本向量包括:
对所述直播间所包含的词向量进行求和操作,得到总词向量;
计算所述总词向量的平均值,并将所述平均值确定为所述直播间的所述文本向量。
7.根据权利要求1所述的直播间处理方法,其特征在于,根据两个所述直播间的文本向量计算两个所述直播间之间的相似度包括:
计算两个所述直播间对应的文本向量之间的夹角余弦,并根据所述夹角余弦确定两个所述直播间之间的所述相似度。
8.一种直播间处理装置,其特征在于,包括:
文本获取模块,用于获取直播间的目标文本,所述目标文本包括标题信息和/或弹幕信息;
向量确定模块,用于对所述直播间的所述目标文本进行分词得到分词后的文本,并根据所述分词后的文本确定所述直播间的文本向量;
相似度计算模块,用于根据两个所述直播间的文本向量计算两个所述直播间之间的相似度,以便于根据所述相似度进行直播间处理。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任意一项所述的直播间处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述的直播间处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910646605.0/1.html,转载请声明来源钻瓜专利网。





