[发明专利]基于视频字幕的知识图谱构建方法、装置及计算设备在审
申请号: | 202010450442.1 | 申请日: | 2020-05-25 |
公开(公告)号: | CN113722540A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 李薇;曹旭;周波;王锋;周丽莎 | 申请(专利权)人: | 中国移动通信集团重庆有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;H04N5/278 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 王广涛 |
地址: | 401121*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 字幕 知识 图谱 构建 方法 装置 计算 设备 | ||
1.一种基于视频字幕的知识图谱构建方法,其特征在于,所述方法包括:
获取用户上传的视频实体,并根据所述视频提取的视频字幕;
根据所述视频实体以及所述视频字幕获取所述视频实体的关键词,构成关键词组;
将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系,构建新的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述根据所述视频实体以及所述视频字幕获取所述视频实体的关键词,构成关键词组,包括:
将所述视频实体标识、所述视频实体名称以及所述视频字幕组成分布式数据集,并对所述分布式数据集进行预处理;
对所述分布式数据集进行分词操作,获取分词后的词语数据;
将获取的所述词语数据进行二次干扰处理;
从二次干扰处理后的所述词语数据中提取所述视频实体的关键词,构成所述关键词组。
3.根据权利要求2所述的方法,其特征在于,所述从二次干扰处理后的所述词语数据中提取所述视频实体的关键词,构成所述关键词组,包括:
采用第一算法从所述词语数据中提取第一关键词数据;
采用第二算法从所述词语数据中提取第二关键词数据;
合并所述第一关键词数据和所述第二关键词数据,构成所述关键词组。
4.一种基于视频字幕的知识图谱构建方法,其特征在于,所述方法包括:
接收用户端上传的第一视频实体的数据集,其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组;
计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度;
根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系,构建新的知识图谱;
为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务。
5.根据权利要求4所述的方法,其特征在于,所述计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度,包括:
计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度Pi;
根据所述语义相似度Pi应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P:
其中,i为正整数,n为所述第一关键词组中关键词的个数,m为所述第二关键词组中关键词的个数。
6.根据权利要求4所述的方法,其特征在于,所述根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系,构建新的知识图谱,包括:
如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值,则确定所述第一视频实体与所述第二视频实体的实体关系为强关联;
如果所述第一关键词组与所述第二关键词组的相似度小于所述第一阈值,且大于等于第二阈值,则确定所述第一视频实体与所述第二视频实体的实体关系为弱关联;
如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值,则确定所述第一视频实体与所述第二视频实体的实体关系为无关联;
在所述原始知识图谱中增加新的节点,建立所述第一视频实体与所述第二视频实体的双向关系。
7.一种基于视频字幕的知识图谱构建装置,其特征在于,所述装置包括:
字幕提取单元,用于获取用户上传的视频实体,并根据所述视频提取的视频字幕;
关键词获取单元,用于根据所述视频实体以及所述视频字幕获取所述视频实体的关键词,构成关键词组;
发送单元,用于将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系,构建新的知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团重庆有限公司;中国移动通信集团有限公司,未经中国移动通信集团重庆有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010450442.1/1.html,转载请声明来源钻瓜专利网。