[发明专利]数字提取方法和装置、存储介质及电子装置有效
申请号: | 201810961840.2 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109299439B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 包恒耀 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/12;G06F40/258;G06F40/284 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷;江舟 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字 提取 方法 装置 存储 介质 电子 | ||
本发明公开了一种数字提取方法和装置、存储介质及电子装置。其中,该方法包括:获取与输入的查询指令相匹配的指令文本;对指令文本执行分词标注处理,得到指令分词集合,其中,指令分词集合中的每一个指令分词分别配置有词性标签;根据词性标签从指令分词集合中确定出目标指令分词,其中,目标指令分词中包含有效数字信息;根据指令分词集合中所包含的目标指令分词之间的位置关系,从指令文本中提取出与有效数字信息匹配的目标数字,其中,目标数字为允许机器识别的数字。本发明解决了相关技术中数字提取准确性低的技术问题。
技术领域
本发明涉及计算机领域,具体而言,涉及一种数字提取方法和装置、存储介质及电子装置。
背景技术
在用户向硬件设备输入的指令中,常常会携带一些数字信息,如包含用于表示货币、时间、长度、距离等数字词语的信息。为了方便硬件设备对上述数字信息中所携带的数字执行相应的机器处理操作,往往需要先从指令中提取出上述数字。
目前,硬件设备在获取到指令对应的指令文本之后,常用的提取方式为:利用正则匹配公式对指令文本进行简单匹配,以提取出指令文本中数字信息所携带的数字。然而,在指令文本中常常会出现特殊数字,如无意义的汉字数字或汉字数字和阿拉伯数字被混合使用的复合数字。针对上述特殊数字,若继续采用相关技术所采用的数字提取方法,将导致数字提取的准确性低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数字提取方法和装置、存储介质及电子装置,以至少解决相关技术中数字提取准确性低的技术问题。
根据本发明实施例的一个方面,提供了一种数字提取方法,包括:获取与输入的查询指令相匹配的指令文本;对上述指令文本执行分词标注处理,得到指令分词集合,其中,上述指令分词集合中的每一个指令分词分别配置有词性标签;根据上述词性标签从上述指令分词集合中确定出目标指令分词,其中,上述目标指令分词中包含有效数字信息;根据上述指令分词集合中所包含的上述目标指令分词之间的位置关系,从上述指令文本中提取出与上述有效数字信息匹配的目标数字,其中,上述目标数字为允许机器识别的数字。
根据本发明实施例的另一方面,还提供了一种数字提取装置,包括:获取单元,用于获取与输入的查询指令相匹配的指令文本;处理单元,用于对上述指令文本执行分词标注处理,得到指令分词集合,其中,上述指令分词集合中的每一个指令分词分别配置有词性标签;确定单元,用于根据上述词性标签从上述指令分词集合中确定出目标指令分词,其中,上述目标指令分词中包含有效数字信息;提取单元,用于根据上述指令分词集合中所包含的上述目标指令分词之间的位置关系,从上述指令文本中提取出与上述有效数字信息匹配的目标数字,其中,上述目标数字为允许机器识别的数字。
作为一种可选的示例,上述提取单元包括:第三提取模块,用于在上述获取上述有效数字信息中所携带的数字的数字格式之后,在上述数字格式均为阿拉伯数字的情况下,提取上述有效数字信息所携带的数字,作为上述目标数字。
作为一种可选的示例,上述确定单元包括:第三获取模块,用于从上述指令分词集合中,获取上述词性标签指示为数词的指令分词,作为上述目标指令分词,其中,上述词性标签指示为数词的指令分词中包含上述有效数字信息。
作为一种可选的示例,上述获取单元包括以下至少之一:第四获取模块,用于获取语音输入的上述查询指令;识别上述查询指令中所携带的指令信息;根据上述指令信息生成上述指令文本;第五获取模块,用于获取通过输入设备输入的上述查询指令;解析上述查询指令,得到上述指令文本。
根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述数字提取方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的数字提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810961840.2/2.html,转载请声明来源钻瓜专利网。