[发明专利]语义标签生成方法及设备、计算机存储介质在审
申请号: | 201810344523.6 | 申请日: | 2018-04-17 |
公开(公告)号: | CN110399505A | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 胡磊;张旭 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义标签 维度 计算机存储介质 相关信息 语义完整 预先设置 组合连接 有效地 申请 搜索 标签 清晰 应用 | ||
本申请实施例提供了一种语义标签生成方法及设备、计算机存储介质,本申请中,为媒体预先设置有描述维度和描述维度的组合要求,之后利用组合要求,将描述维度对应的描述维值进行组合连接,能够生成含义清晰、语义完整的语义标签,克服了现有技术中直接从媒体的相关信息中提取语义标签所造成的标签数量少的缺陷。进一步地,利用生成的多个语义标签能够有效地支持媒体的推荐、搜索等应用。
技术领域
本申请实施例涉及计算机及文本处理技术领域,并且更具体地,涉及一种语义标签生成方法及设备、计算机存储介质。
背景技术
为了满足用户对视频、音频、网页等媒体信息的搜索定位需求,在对媒体进行管理时,通常会为每个媒体设置至少一个能够反映媒体内容或用户使用感受的标签。由于不同的标签可以从不同的维度对媒体进行描述,因此使用者可以通过标签实现对资源信息细粒度、多维度的搜索定位。例如,视频运营网站为了满足用户对视频搜索定位的需求,通常会为视频设置视频标签,从而使用户可以利用视频标签快速的搜索到需要的视频。
媒体的标签通常可以直接从媒体的关联文本中提取,所述关联文本包括但不限于对应媒体资源的元数据、简介、评论或字幕等。例如可以采用自然语言处理(NaturalLanguage Processing,NLP)的技术,按照预设的提取规则从媒体的关联文本中提取媒体相对应的标签。
由于关联文本的种类多样,因此按照预设的提取规则从关联文本中提取的标签可能存在噪音,所以在提取出标签之后,还需要进行多个过滤环节,滤除标签中的噪音,才能得到最终的标签。在实际使用中,预设的提取规则通常会比较有限,因此按照预设的提取规则从关联文本中提取出的标签数量本身就比较有限,再经过过滤后会进一步减少标签的数量,导致最终得到的标签数量十分有限。
发明内容
本申请实施例提供一种语义标签生成方法及设备、计算机存储介质,其利用媒体的标签提取语法规则和描述维度,结合媒体的相关信息,能够形成多个语义标签,克服了利用现有技术形成的语义标签数量少的缺陷。
第一方面,提供了一种语义标签生成方法,该方法用于生成媒体的语义标签,具体包括:
获取媒体的相关信息、所述媒体的描述维度的组合要求,所述组合要求用于表示所述媒体的多个所述描述维度对应的描述维值的组合形式;这里的相关信息是指从媒体上直接得到的文本信息或从媒体的相关网站上获取到的关于媒体内容、媒体评价等的关联文本信息。这里的媒体是指传播信息的媒介,例如可以是视频、音频、网页、音乐的等。这里的组合要求是为媒体预先设定的,不同的媒体可以设置有不同的组合要求,同一媒体可以设置有多个组合要求。这里的描述维度为描述媒体的一个预定角度,一个媒体预先设定了多个描述维度。
根据所述媒体的相关信息确定所述描述维度对应的描述维值,所述描述维值为从所述描述维度描述所述媒体的词汇。这里的描述维值是描述维度的具体取值,描述维值不限于是一个词汇,还可以是包括多个词汇的短语;这里的描述维值是一个预定的词汇或短语。
根据所述组合要求和所述描述维度对应的描述维值生成所述媒体的语义标签。这里的组合要求用于表示媒体的多个描述维度对应的描述维值的组合形式,根据组合要求中表示的描述维值的组合形式和各个描述维度对应的描述维值即可生成语义标签。由于组合要求包括多个描述维度对应的描述维值的组合形式,因此利用上述组合要求生成的语义标签能够从至少一个角度描述媒体。
本方面中,利用媒体的描述维度的组合要求,将描述维度对应的描述维值进行组合,能够生成含义清晰、语义完整的语义标签,克服了现有技术中直接从媒体的相关信息中提取语义标签所造成的标签数量少的缺陷。同时,利用不同的描述维度对应的描述维值进行组合能够形成含义丰富语义标签,继而利用生成的稠密、多样的语义标签能够有效地支持媒体的推荐、搜索等应用。
结合第一方面,在第一种可能的实现方式中,所述根据所述组合要求和所述描述维度对应的描述维值生成所述媒体的语义标签,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810344523.6/2.html,转载请声明来源钻瓜专利网。