[发明专利]描述词识别方法、装置、介质及电子设备在审
| 申请号: | 202111290578.1 | 申请日: | 2021-11-02 |
| 公开(公告)号: | CN114003740A | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 孙斌 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
| 主分类号: | G06F16/45 | 分类号: | G06F16/45;G06F16/483;G06F40/289;G06Q30/02;G06V20/40;G06V30/10 |
| 代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贾会玲 |
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 描述 识别 方法 装置 介质 电子设备 | ||
1.一种描述词识别方法,其特征在于,包括:
获取待识别的多媒体物料;
将所述多媒体物料拆分为物料元素;
针对每一所述物料元素,识别该物料元素所包含的目标描述词;
将每一所述物料元素所包含的目标描述词进行融合,得到所述多媒体物料所包含的目标描述词。
2.根据权利要求1所述的方法,其特征在于,在该物料元素为文本元素时,所述识别该物料元素所包含的目标描述词,包括:
对该物料元素进行分词;
对分词后所得的词汇进行变体,得到变体词汇;
判断所述分词后所得的词汇和所述变体词汇中是否存在位于目标描述词库中的词汇;
若所述分词后所得的词汇和所述变体词汇中存在位于所述目标描述词库中的词汇,则将分词后所得的词汇和所述变体词汇中、位于所述目标描述词库中的词汇作为该物料元素所包含的目标描述词。
3.根据权利要求2所述的方法,其特征在于,在所述将分词后所得的词汇和所述变体词汇中、位于所述目标描述词库中的词汇作为该物料元素所包含的目标描述词的步骤之前,所述识别该物料元素所包含的目标描述词,还包括:
若所述分词后所得的词汇和所述变体词汇中存在位于所述目标描述词库中的词汇,则确定该物料元素中是否包含目标描述词;
所述将分词后所得的词汇和所述变体词汇中、位于所述目标描述词库中的词汇作为该物料元素所包含的目标描述词,包括:
若所述物料元素中包含目标描述词,则将所述分词后所得的词汇和所述变体词汇中、位于所述目标描述词库中的词汇作为该物料元素所包含的目标描述词。
4.根据权利要求3所述的方法,其特征在于,所述识别该物料元素所包含的目标描述词,还包括:
若所述物料元素中不包含目标描述词,则确定该物料元素中不包含目标描述词。
5.根据权利要求2所述的方法,其特征在于,所述识别该物料元素所包含的目标描述词,还包括:
确定该物料元素中是否存在目标描述词推广短语;
若所述物料元素中存在目标描述词推广短语,则将该物料元素中的目标描述词推广短语所对应的目标描述词作为该物料元素所包含的目标描述词。
6.根据权利要求1所述的方法,其特征在于,在该物料元素为图像元素时,所述识别该物料元素所包含的目标描述词,包括:
对该物料元素进行目标检测;
若目标检测结果包含目标描述词,则将所述目标检测结果中的目标描述词作为该物料元素所包含的目标描述词;
若所述目标检测结果包含目标描述词的图形标识的位置信息,则根据所述位置信息,从该物料元素中提取所述图形标识;提取所述图形标识的目标图像特征;将图形标识特征库中与所述目标图像特征相匹配的图像特征对应的目标描述词确定为该物料元素所包含的目标描述词;
若所述目标检测结果为空,则确定该物料元素中不包含目标描述词。
7.根据权利要求6所述的方法,其特征在于,所述识别该物料元素所包含的目标描述词,还包括:
获取该物料元素中的文本区域;
提取所述文本区域的目标文本特征;
将目标描述词文本特征库中与所述目标文本特征相匹配的文本特征对应的目标描述词确定为该物料元素所包含的目标描述词。
8.根据权利要求1所述的方法,其特征在于,在该物料元素为视频元素时,所述识别该物料元素所包含的目标描述词,包括:
判断目标描述词视频库中是否存在与该物料元素相匹配的视频;
若所述目标描述词视频库中存在所述相匹配的视频,则将所述相匹配的视频对应的目标描述词作为该物料元素所包含的目标描述词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111290578.1/1.html,转载请声明来源钻瓜专利网。





