[发明专利]提取上位词的方法、系统、电子装置和存储介质有效
申请号: | 202210007982.1 | 申请日: | 2022-01-06 |
公开(公告)号: | CN114020880B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 赵鹏阳;金霞;杨红飞;程东 | 申请(专利权)人: | 杭州费尔斯通科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 张超 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 上位 方法 系统 电子 装置 存储 介质 | ||
本申请涉及一种提取上位词的方法、系统、电子装置和存储介质,通过获取待查词语,以及待查词语的知识库词条;在知识库词条中包含短解释的情况下,对短解释进行分词,获得第一分词结果;提取第一分词结果中最后一个名词,作为待查词语的上位词,由于知识库中几乎涵盖所有待查词语的词条,可以满足更广泛的中文上位词的查询需求,且知识库可以及时更新新词,可以满足对新词进行上位词查询的需要,解决了基于WordNet查询上位词,无法满足更广泛的中文上位词的查询需求,以及无法满足对新词进行上位词查询的需要的问题。
技术领域
本申请涉及计算机技术领域,特别是涉及提取上位词的方法、系统、电子装置和存储介质。
背景技术
随着网络技术的发展,网络搜索技术得到了不断的完善,通过网络搜索技术可以从互联网上获取各种信息。例如,用户提交一个待查词语,网站向用户返回一个与该待查词语相关的搜索结果。其中,搜索结果中可以包含该待查词语对应的上位词的结果,若待查词语为“鲜花”,则对应的上位词为“花”,因此,如何确定某一个词对应的上位词是一个重要的环节。
而相关技术中,在NLP(自然语言处理)领域,目前提取上位词的方案主要是WordNet,WordNet是由Princeton大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典,具有查询上位词的功能。然而,WordNet主要是针对英语,其汉语版本较英文的上位词要少很多,无法满足更广泛的中文上位词的查询需求,且WordNet诞生于20世纪80年代,其中的词汇是固定的,比较陈旧,缺乏很多新词,无法满足对新词进行上位词查询的需要。
目前针对相关技术中基于WordNet查询上位词,无法满足更广泛的中文上位词的查询需求,以及无法满足对新词进行上位词查询的需要的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种提取上位词的方法、系统、电子装置和存储介质,以至少解决相关技术中基于WordNet查询上位词,无法满足更广泛的中文上位词的查询需求,以及无法满足对新词进行上位词查询的需要的问题。
第一方面,本申请实施例提供了一种提取上位词的方法,所述方法包括:
获取待查词语,以及所述待查词语的知识库词条;
在所述知识库词条中包含短解释的情况下,对所述短解释进行分词,获得第一分词结果;
提取所述第一分词结果中最后一个名词,作为所述待查词语的上位词。
在其中一些实施例中,在所述知识库词条中不包含短解释的情况下,所述方法包括:
判断所述待查词语是否可进行分词;
在所述待查词语可进行分词的情况下,对所述待查词语进行分词,获得第二分词结果;
提取所述第二分词结果中最后一个名词,作为所述待查词语的上位词。
在其中一些实施例中,在所述待查词语不可进行分词的情况下,所述方法还包括:
获取所述知识库词条的第一个自然段内包含所述待查词语的句子;
在所述句子中包含判断动词的情况下,根据所述句子中的判断动词,获取所述句子中的解释表语;
根据所述解释表语中的名词,获取所述待查词语的上位词。
在其中一些实施例中,在所述句子中不包含判断动词的情况下,所述方法包括:
排除所述句子中包含所述待查词语,和/或,包含动词的第一子句,获得余下的第二子句;
判断所述余下的第二子句是否为名词短语,将为名词短语的第二子句作为所述句子的解释表语;
根据所述解释表语中的名词,获取所述待查词语的上位词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州费尔斯通科技有限公司,未经杭州费尔斯通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210007982.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:叠层电子元件安装过程的对准装置
- 下一篇:一种脉冲阻尼器及半导体设备