[发明专利]基于动态模型的文本属性提取匹配方法有效
申请号: | 202210478783.9 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114579712B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 杨波;王小莉;秦克良 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06K9/62 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 黄利萍 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 模型 文本 属性 提取 匹配 方法 | ||
本发明提供一种基于动态模型的文本属性提取匹配系统,能够自动对文本数据中的属性名进行自动提取和匹配,能够提高提取和匹配速度以及准确性。
技术领域
本申请涉及文本识别领域,具体涉及一种基于动态模型的文本属性提取匹配方法。
背景技术
一般对于生活中的物资,都配备有对应的说明书,以便获知该物资的特点和作用。当前,都是通过人工从说明书中获取其中的属性,以便获知对应物资的属性信息,例如,物资名称、物资成份等属性信息。然而,对于大批量的说明书,这种人工获取的方式存在效率低下,劳动强度大等缺陷。
发明内容
针对上述技术问题,本发明实施例提供一种基于动态模型的文本属性提取匹配系统,用于至少解决上述技术问题之一。
本发明实施例采用的技术方案为:
本发明实施例提供一种基于动态模型的文本属性提取匹配系统,包括:通信连接的处理器、存储器和数据库,所述存储器中存储有N类目标对象的文本数据,所述数据库的第i行包括(Ci,A0i,Di,R0i),Ci为第i类目标对象的ID,A0i为Ci对应的文本数据Ti的当前属性名集,A0i的初始值为Null;Di=(Di1,Di2,…,Dimi),Dij为Ti对应的数据元集Di中的第j个数据元;R0i为与A0i对应的匹配结果集,R0i∈Di,R0i的初始值为Null;
对于任一目标对象i的文本数据Ti,所述处理器用于执行计算机程序,以实现如下步骤:
S10,基于Ti,从数据库中获取对应的当前属性名集A0i;如果A0i不为Null,执行S20,否则,执行S30;
S20,基于A0i提取Ti中的属性名,得到Ti的属性名集Ai;
S30,基于设定的提取规则提取Ti中的属性,得到Ti的属性名集Ai;
S40,基于Ti,对Ai进行修正,得到修正后的属性名集Aci=(Aci1,Aci2,…,Acini),Acir为Aci中的第r个属性名,r的取值为1到ni,ni为Aci中的属性名数量;利用Aci更新A0i;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210478783.9/2.html,转载请声明来源钻瓜专利网。