[发明专利]一种知识抽取方法及装置有效
申请号: | 201910585762.5 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110275966B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 李直旭;宋晓兆;陈志刚 | 申请(专利权)人: | 科大讯飞(苏州)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜 |
地址: | 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种知识抽取方法及装置,在获取第一表格集合后,对该第一表格集合进行类型识别,得到至少一种目标表格类型下的半结构化的各个表格,作为各个第一目标表格,并基于该各个第一目标表格的表格布局特征,从各个第一目标表格中抽取能够用于补全目标知识图谱的知识信息,以便利用知识信息自动补全目标知识图谱,如此实现知识图谱的自动补全。其中,由于自动补全过程中无需人工参与,因而,降低人工成本开销,减少人力资源的浪费。另外,由于表格布局特征能够影响知识信息的抽取效果,因而,当基于各个半结构化的第一目标表格的表格布局特征对各个第一目标表格中知识信息进行抽取时,能够较快地抽取到知识信息,提高了知识信息的抽取效果。 | ||
搜索关键词: | 一种 知识 抽取 方法 装置 | ||
【主权项】:
1.一种知识抽取方法,其特征在于,包括:获取第一表格集合,所述第一表格集合中的每一表格为带有知识的表格;对所述第一表格集合中的表格进行类型识别,得到至少一种目标表格类型下的半结构化的各个表格,作为各个第一目标表格;基于所述各个第一目标表格的表格布局特征,从所述各个第一目标表格中抽取知识信息,所述知识信息用于补全目标知识图谱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞(苏州)科技有限公司,未经科大讯飞(苏州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910585762.5/,转载请声明来源钻瓜专利网。