[发明专利]从非结构化文本提取和显现图表结构化关系的方法和系统有效
申请号: | 200680041525.3 | 申请日: | 2006-09-18 |
公开(公告)号: | CN101305366A | 公开(公告)日: | 2008-11-12 |
发明(设计)人: | H·哈桑;H·莫索塔费 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 朱海波 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了用于从非结构化文本自动提取和挖掘关系和相关实体的系统、方法和计算机程序。更特别地,本发明涉及一种方法,用于:从非结构化文本数据提取关系和相关实体,将所提取信息表示为图表,以及操纵所得图表以更加了解其包含的信息。首先通过自动导入图案以及其次通过将这些导入的图案应用于非结构化文本数据,执行关系和相关实体的提取。对于每个关系和实体,提取多个特征以构造图表,其中节点表示实体,并且边表示关系。本发明提供如下装置,其用于开发图表,并用于导出其他图表,这些图表集中于某些时间帧内的关系或涉及某些特征。这是分别使用时间图表和基于特征的图表来完成的。两种方法基本上都查询与图表的节点和边相关联的数据结构的内容。 | ||
搜索关键词: | 结构 文本 提取 显现 图表 关系 方法 系统 | ||
【主权项】:
1.一种用于从非结构化文本自动提取和挖掘关系和相关实体的方法,所述方法包括以下步骤:·接收指定主实体的查询;·从非结构化文本提取与查询中指定的主实体相关的关系和相关实体,所述步骤包括进一步的步骤:·在非结构化文本中搜索和选择包含主实体的文档,·向所选文档的每个词附加一个或多个标签,每个标签是不同类型的;·通过将图案应用到所述加标签的文档来提取关系和相关实体;·从所选文档提取表征每个实体和关系的特征;·基于所提取特征构造图表,其节点表示与所指定主实体相关的实体并且其边表示所述实体间的关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200680041525.3/,转载请声明来源钻瓜专利网。