[发明专利]信息提取支持设备和方法无效
申请号: | 201510802048.9 | 申请日: | 2015-11-19 |
公开(公告)号: | CN105608069A | 公开(公告)日: | 2016-05-25 |
发明(设计)人: | 冈本昌之;宫村祐一 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李颖 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 提取 支持 设备 方法 | ||
相关申请的交叉引用
本申请基于2014年11月19日递交的日本专利申请2014-234963 号并要求其优先权的权益,这里通过引用并入该日本专利申请的全部 内容。
技术领域
本文描述的实施例一般地涉及信息提取支持设备和方法。
背景技术
从网页或文档提取诸如词的属性(例如,产品名称和产品的价格) 之类的信息的技术是已知的。利用这种技术,可以容易地组织文档内 的特定信息(例如,从文档提取产品的规格的列表并且制作表格)。
然而,如果要提取的信息对于每个文档是不同的,则选择属性是 麻烦的。可以使用传统的技术,即,将多个文档分类到指定的类别中 并且根据该分类来判定要提取哪种信息。
附图说明
图1是示出根据第一实施例的信息提取支持设备的框图。
图2是示出信息提取设备的信息提取处理的流程图。
图3A图示了从目标文档提取的属性表述的示例。
图3B图示了示出目标文档的分析结构的表格的示例。
图4图示了存储在特征存储库中的逻辑规则的示例。
图5图示了在候选属性呈现器和生成器处生成的分析结果的呈现 的示例。
图6是示出根据第二实施例的信息提取支持设备的框图。
图7图示了用户界面的示例。
图8图示了逻辑规则的更新的示例。
具体实施方式
如果提取信息的人(分析者)不是训练有素的或者不是专家,则 可能有这样的问题,即,该人不能认识到根据目的应当提取哪种属性。 尤其,如果要提取的属性取决于特征的组合而变化,则不是专家的人 难以考虑文档与特征之间的关系。此外,如果文档的数目增加,则必 须提取的信息的量增加,并且分析者核对的份额也增加。
一般地,根据一个实施例,信息提取支持设备包括第一获取器、 判定器、选择器和提取器。第一获取器获取从中提取指示某种类型的 期望信息的至少一个属性的文档作为分析目标。判定器判定该至少一 个属性是否有效,并且获得有效属性中的至少一个作为一个或多个候 选属性。选择器从一个或多个候选属性中选择要用于分析的属性作为 选中属性。提取器从文档中提取属于选中属性的表述作为属性表述。
以下,将参考附图详细描述根据当前实施例的信息提取支持设备、 方法和程序。在以下实施例中,执行相同操作的元素将被赋予相同的 附图标记,并且对其的冗余说明将被酌情省略。
(第一实施例)
将参考图1的框图描述根据第一实施例的信息提取支持设备。
根据第一实施例的信息提取支持设备100包括文档获取器101、 特征存储库102、有效性判定器103、候选属性呈现器104、选择器105、 属性表述提取器106和生成器107。
文档获取器101获取要分析的一个或多个目标文档。目标文档可 通过用户输入获取,或者可由外部服务器自动收集。在本实施例中, 假定目标文档是由自然书写表述的文本数据,例如上传在互联网上的 网页和新闻文章。然而,目标文档不限于此,而可以是可从数据提取 属性的任何事物。属性指示用户希望提取的某种类型的期望信息,例 如产品名称、价格和公司名称。文档获取器101可从用户获取分析的 目的(以下也称为“分析目的”)。分析目的可例如是技术地图、供 应链或者家系图,但不限于此。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510802048.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种相关知识点的获取方法及系统
- 下一篇:XBRL实例文档校验方法以及系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置