[发明专利]数字提取方法和装置、存储介质及电子装置有效
申请号: | 201810961840.2 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109299439B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 包恒耀 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/12;G06F40/258;G06F40/284 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷;江舟 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字 提取 方法 装置 存储 介质 电子 | ||
1.一种数字提取方法,其特征在于,包括:
获取与输入的查询指令相匹配的指令文本;
对所述指令文本执行分词标注处理,得到指令分词集合,其中,所述指令分词集合中的每一个指令分词分别配置有词性标签;
根据所述词性标签从所述指令分词集合中确定出目标指令分词,其中,所述目标指令分词中包含有效数字信息;
其中,所述根据所述词性标签从所述指令分词集合中确定出目标指令分词,包括:从所述指令分词集合中,获取所述词性标签指示为数词的指令分词,作为所述目标指令分词,其中,所述词性标签指示为数词的指令分词中包含数字信息;在所述数字信息包含有效数字信息与无效数字信息的情况下,获取包含所述有效数字信息的指令分词,作为所述目标指令分词,所述有效数字信息为具有数学意义的数字,所述无效数字信息用于表示没有数学意义的数字;
根据所述指令分词集合中所包含的所述目标指令分词之间的位置关系,从所述指令文本中提取出与所述有效数字信息匹配的目标数字,其中,所述目标数字为允许机器识别的数字;
所述根据所述指令分词集合中所包含的所述目标指令分词之间的位置关系,从所述指令文本中提取出与所述有效数字信息匹配的目标数字,包括:
获取在所述指令分词集合中的第一关键分词及第二关键分词,其中,所述第一关键分词与所述目标指令分词相邻且位于所述目标指令分词之前,所述第二关键分词与所述目标指令分词相邻且位于所述目标指令分词之后,其中,所述第一关键分词以及所述第二关键分词为用于表示数字的词;
将所述第一关键分词、所述目标指令分词及所述第二关键分词组合得到候选字段;
调用复合数字模板与所述候选字段进行比对;
在所述候选字段与所述复合数字模板匹配的情况下,按照所述复合数字模板提取所述目标数字。
2.根据权利要求1所述的方法,其特征在于,所述根据指令分词集合中所包含的所述目标指令分词之间的位置关系,从所述指令文本中提取出与所述有效数字信息匹配的目标数字包括:
获取所述指令分词集合中所包含的全部所述有效数字信息中所携带的数字的数字格式;
在所述数字格式包含汉字数字的情况下,根据所述指令分词集合中所包含的所述目标指令分词之间的位置关系,确定所述汉字数字的提取模式;
按照所述提取模式提取出所述目标数字。
3.根据权利要求2所述的方法,其特征在于,
所述根据所述指令分词集合中所包含的所述目标指令分词之间的位置关系,确定所述汉字数字的提取模式包括:在所述指令分词集合中至少两个所述目标指令分词所在的位置为连续位置,且所述至少两个所述目标指令分词中所包含的所述有效数字信息的数据类型均为整数类型的情况下,确定所述至少两个所述目标指令分词的所述提取模式为组合提取模式;
所述按照所述提取模式提取出所述目标数字包括:按照所述组合提取模式,组合所述至少两个所述目标指令分词,得到组合指令字段;提取与所述组合指令字段相匹配的所述目标数字。
4.根据权利要求2所述的方法,其特征在于,
所述根据所述指令分词集合中所包含的所述目标指令分词之间的位置关系,确定所述汉字数字的提取模式包括:在所述指令分词集合中所述目标指令分词所在的位置均为离散位置的情况下,确定所述提取模式为离散提取模式;
所述按照所述提取模式提取出所述目标数字包括:按照所述离散提取模式,分别提取所述指令分词集合中所述目标指令分词包含的所述有效数字信息所携带的数字,作为所述目标数字。
5.根据权利要求2所述的方法,其特征在于,在所述获取所述有效数字信息中所携带的数字的数字格式之后,还包括:
在所述数字格式均为阿拉伯数字的情况下,提取所述有效数字信息所携带的数字,作为所述目标数字。
6.根据权利要求1至5中任一项所述的方法,所述根据所述词性标签从所述指令分词集合中确定出目标指令分词包括:
从所述指令分词集合中,获取所述词性标签指示为数词的指令分词,作为所述目标指令分词,其中,所述词性标签指示为数词的指令分词中包含所述有效数字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810961840.2/1.html,转载请声明来源钻瓜专利网。