[发明专利]一种自定义规则的文本信息抽取结果筛选方法及装置有效
申请号: | 201710961777.8 | 申请日: | 2017-10-16 |
公开(公告)号: | CN107729481B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 席丽娜;李德彦;晋耀红 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自定义 规则 文本 信息 抽取 结果 筛选 方法 装置 | ||
1.一种自定义规则的文本信息抽取结果筛选方法,其特征在于,所述方法包括:
获取待抽取文本信息和预设的模型树,所述模型树包括至少若干个节点和每个节点对应的抽取表达式集,所述抽取表达式集包括至少一个抽取表达式;
响应于用户选择所述节点的操作,利用所述模型树中所选节点对应的抽取表达式集对所述待抽取文本信息进行信息抽取,得到抽取结果;
获取所述模型树对应的预设节点路径;
利用所述预设节点路径的终止节点,按照预设的筛选规则,对所述抽取结果进行筛选,得到筛选结果,所述终止节点为节点路径的结束的节点;所述预设的筛选规则为全节点筛选规则、子节点筛选规则或当前节点筛选规则;
当预设的筛选规则为当前节点筛选规则时,根据所述预设节点路径的终止节点,查找与所述终止节点对应的抽取结果。
2.如权利要求1所述的方法,其特征在于,当预设的筛选规则为子节点筛选规则时,所述利用所述预设节点路径的终止节点,按照预设的筛选规则,对所述抽取结果进行筛选包括:
判断所述预设节点路径的终止节点是否具有子节点;
如果所述终止节点具有子节点,则根据所述子节点,查找与所述子节点相对应的抽取结果。
3.如权利要求1所述的方法,其特征在于,当预设的筛选规则为全节点筛选规则时,所述利用所述节点路径的终止节点,按照预设的筛选规则,对所述抽取结果进行筛选包括:
判断所述预设节点路径的终止节点是否具有子孙节点,所述子孙节点为后继于所述终止节点的第一层级至第N层级的所有节点,其中,后继于所述终止节点的第N层级的节点为最末层级节点,N为大于1的正整数;
如果所述节点路径的终止节点具有子孙节点,则根据所述子孙节点,查找与所述子孙节点相对应的抽取结果。
4.如权利要求1-3任意一项所述的方法,其特征在于,所述利用所述预设节点路径的终止节点,按照预设的筛选规则,对所述抽取结果进行筛选,得到筛选结果之后包括:
根据所述筛选结果及所述模型树中与所述筛选结果相对应的节点,生成key-value键值对集;
将所述key-value键值对集输出。
5.一种基于文本信息抽取结果的筛选装置,其特征在于,所述装置包括:
第一获取模块,用于获取待抽取文本信息和预设的模型树,所述模型树包括至少若干个节点和每个节点对应的抽取表达式集,所述抽取表达式集包括至少一个抽取表达式;
抽取模块,用于响应于用户选择所述节点的操作,利用所述模型树中所选节点对应的抽取表达式集对所述待抽取文本信息进行信息抽取,得到抽取结果;
第二获取模块,用于获取所述模型树对应的预设节点路径;
筛选模块,用于利用所述预设节点路径的终止节点,按照预设的筛选规则,对所述抽取结果进行筛选,得到筛选结果,所述终止节点为节点路径的结束的节点;所述预设的筛选规则为全节点筛选规则、子节点筛选规则或当前节点筛选规则;
所述预设的筛选规则为当前节点筛选规则时,所述筛选模块包括:
第三查找单元,用于根据所述预设节点路径的终止节点,查找与所述终止节点对应的抽取结果。
6.如权利要求5所述的装置,其特征在于,当预设的筛选规则为子节点筛选规则时,所述筛选模块包括:
第一判断单元,用于判断所述预设节点路径的终止节点是否具有子节点;
第一查找单元,用于如果所述节点路径的终止节点具有子节点,则根据所述子节点,查找与所述子节点相对应的抽取结果。
7.如权利要求5所述的装置,其特征在于,当预设的筛选规则为全节点筛选规则时,所述筛选模块包括:
第二判断单元,用于判断所述预设节点路径的终止节点是否具有子孙节点,所述子孙节点为后继于所述终止节点的第一层级至第N层级的所有节点,其中,后继于所述终止节点的第N层级的节点为最末层级节点,N为大于1的正整数;
第二查找单元,用于如果所述节点路径的终止节点具有子孙节点,则根据所述子孙节点,查找与所述子孙节点相对应的抽取结果。
8.如权利要求5-7任意一项所述的装置,其特征在于,所述装置还包括:
生成单元,用于根据所述筛选结果及所述模型树中与所述筛选结果相对应的节点,生成key-value键值对集;
输出单元,用于将所述key-value键值对集输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710961777.8/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置