|
钻瓜专利网为您找到相关结果 299524个,建议您 升级VIP下载更多相关专利
- [发明专利]Web信息抽取系统-CN200910012239.X无效
-
陈荣;郭银蕊;刘亚清;陈涛;陈娟;孙向伟;史玉翡
-
大连海事大学
-
2009-06-24
-
2009-11-18
-
G06F17/30
- 本发明公开了一种Web信息抽取系统,其特征在于包括:检索解析模块、规则生成模块和数据抽取存储模块:检索解析模块包括网络爬虫单元和HTML解析器;规则生成模块包括单槽抽取规则生成单元和多槽抽取规则生成单元;数据抽取存储模块,规则生成模块生成的抽取规则,从检索解析模块下载的网页上提取数据并以结构化的形式存储。该系统具有:生成单槽抽取规则时界面操作简单、容易理解;对于生成多槽抽取规则,系统提供图形界面帮助用户标注,节省用户的时间和体力;对于预先生成的抽取规则和任务序列,系统提供两种方式实现批量任务的抽取和存储;系统可以根据用户配置的参数,在预先设定的周期和时间完成抽取存储任务。
- web信息抽取系统
- [发明专利]知识抽取方法、设备及计算机存储介质-CN202211274953.8在审
-
涂丽燕
-
超聚变数字技术有限公司
-
2022-10-18
-
2023-01-31
-
G06N5/025
- 本申请提供了一种知识抽取方法、设备及计算机存储介质。在实施例中,获取多个文档;获取第一文件,第一文件包括内容抽取规则、多个实体类型的实体抽取规则和多个实体类型的实体关系抽取规则;基于内容抽取规则,从多个文档中确定采用第二抽取规则的第一信息;基于实体抽取规则,对第一信息进行实体抽取,确定实体抽取结果;其中,实体抽取结果包括多个实体和多个实体各自对应的属性信息,属性信息包括多个实体类型中的任一实体类型;基于实体关系抽取规则和多个实体各自对应的属性信息,建立多个实体中部分或全部之间的关系,确定实体关系抽取结果。能够按照实体类型进行模式化的规则定义,统一抽取模型框架,提高抽取效率。
- 知识抽取方法设备计算机存储介质
- [发明专利]信息抽取方法及装置-CN201810401030.1有效
-
李德彦;晋耀红;吴相博
-
北京神州泰岳软件股份有限公司
-
2018-04-28
-
2022-04-19
-
G06F40/131
- 本发明实施例公开一种信息抽取方法及装置,该方法包括:获取待抽取信息的文本和抽取表达式,所述抽取表达式包括区域确定规则和信息抽取规则,所述区域确定规则中包含统计算子,所述统计算子表征用于识别文本中的命名实体和/或依存成分的统计模型;利用统计模型识别所述文本中的命名实体和/或依存成分,为识别出的命名实体和/或依存成分分别标记对应的识别标签;利用所述识别标签比对所述区域确定规则和所述文本,确定所述文本中的有效抽取区域;从所述有效抽取区域中抽取出与所述信息抽取规则匹配的字符串。上述方法以规则的方式来调用统计模型,方便灵活,同时扩大了识别词汇的范围,减少规则构建,更加准确地抽取出用户需要的信息。
- 信息抽取方法装置
|