[发明专利]用于文档分析的基于语义的方法和装置无效

专利信息
申请号: 200880012107.0 申请日: 2008-02-11
公开(公告)号: CN101681348A 公开(公告)日: 2010-03-24
发明(设计)人: M·J·维特布罗克;D·A·施奈德;B·P·罗德;B·阿尔达 申请(专利权)人: 塞科普公司
主分类号: G06F17/00 分类号: G06F17/00
代理公司: 中国专利代理(香港)有限公司 代理人: 张雪梅;蒋 骏
地址: 美国德*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 文档 分析 基于 语义 方法 装置
【说明书】:

相关申请的交叉引用

[0001]本非临时申请要求基于题为“A Semantics-Based Method and Apparatus for Selecting Interpretations of Text Strings”、以Michael John Witbrock、David Andrew Schneider、Benjamin Paul Rode、和Bjoern Aldag的名义于2006年11月7日提交的在先美国临时专利申请Serial No.60/857379的优先权。

背景技术和发明内容

[0002]因特网及其它计算机网络已成为信息传输的支柱。就此 而言,相关数据存储的有效分析和搜索极为重要。如果自动机器可以 处理包含在口语或书面自然语言中的意义,则计算机技术的许多应用 将被更好地实现并享受提高的稳健性和完整性。以前,由在文档本身 中出现的词条或源自该文档所在的文集、较大文档集或这两者的统计 模型来导出此类解释。

[0003]因此,公开了一种用于产生文本的富含语义的表示的新 型系统和方法,所述系统和方法利用语义模型来放大并加深文本的解 释。这种方法不仅可适用于产生文本的语义表示,而且可适用于匹配 多个文本的表示。所述方法依赖于这样的事实,即存在相当数量的与 大多数文本串相关联的语义内容,其在那些串中或仅仅在该串与其它 串的统计共现中是不明确的,但其仍然与文本极其相关。

[0004]此附加信息可以用来加深直接从文本串导出的表示,而 且还对该表示扩充虽未在该串中明确提及、但在文本中是暗含的、且 如果使其明确则可以用来支持文本处理应用的性能的内容,所述文本 处理应用包括文档标引和检索、文档分类、文档传阅(document routing)、文档综述、以及文档加标签。这些改进还支持下游处理, 诸如自动化文档阅读和理解、在线广告设置、电子商务、企业知识管 理、以及商业和政府智能应用。

附图说明

[0005]阅读以下详细说明时和参考附图时,本发明的前述及其 它优点将变得显而易见,在附图中:

[0006]图1是举例说明其中利用数据存储的语义表示的本发明 的一个实施例的数据流程图;

[0007]图2是举例说明包括对为什么检索文档并访问标记的文 档和原始文档的可用解释的语义搜索结果的数据流程图;

[0008]图3是举例说明依照本发明的实施例的语义解释器的一 个实施例的数据流程图。

[0009]虽然本发明可以接受各种修改和替代形式,但已在附图 中通过举例示出并将在本文中详细描述特定实施例。然而,应理解的 是,本发明并不意图局限于所公开的特定形式。相反,本发明将涵盖 在随附权利要求所限定的本发明的精神和范围内的所有修改、等价 物、以及替代。

具体实施方式

[0010]如上所述,本发明的实施例提供了用于文本的解释、分 析和搜索的基于语义模型的系统和方法。另外,所述模型可以有利地 应用于图示、描述图像的信息、发言记录、音乐唱片的描述信息等等。

[0011]公开了一种用于产生文本的富含语义的表示的新型系统 和方法,所述系统和方法利用语义模型来放大并加深文本的解释。这 种方法不仅可适用于产生文本的语义表示,而且可适用于匹配多个文 本的表示。所述方法依赖于这样的事实,即存在相当数量的与大多数 文本串相关联的语义内容,其在那些串中或仅仅在该串与其它串的统 计共现中不明确,但其仍然与文本极其相关。此附加信息既用来加深 直接从文本串导出的表示,而且还对该表示扩充虽未在该串中明确提 及、但在文本中是暗含的、且如果使其明确则可以用来支持文本处理 应用的性能的内容,所述文本处理应用包括文档标引和检索、文档分 类、文档传阅、基于可以由文档中的特定注解术语(term)或以其它 方式来举例说明的概括性总结的文档综述、文档之间的自动链接、文 档与用文档元特征加标签的文档之间的不一致性的检测,所述元特征 诸如作者的态度或情感倾向、或预定目标读者的性格。然后,可以使 用这些改进来支持下游处理,诸如自动化文档阅读和理解、在线广告 设置、电子商务、企业知识管理、基于信息用户访问或产生的信息的 意义的信息用户之间的合作或社会联网机会的识别、以及商业和政府 智能应用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塞科普公司,未经塞科普公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200880012107.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top