[发明专利]用于文档分析的基于语义的方法和装置无效
申请号: | 200880012107.0 | 申请日: | 2008-02-11 |
公开(公告)号: | CN101681348A | 公开(公告)日: | 2010-03-24 |
发明(设计)人: | M·J·维特布罗克;D·A·施奈德;B·P·罗德;B·阿尔达 | 申请(专利权)人: | 塞科普公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 张雪梅;蒋 骏 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文档 分析 基于 语义 方法 装置 | ||
相关申请的交叉引用
[0001]本非临时申请要求基于题为“A Semantics-Based Method and Apparatus for Selecting Interpretations of Text Strings”、以Michael John Witbrock、David Andrew Schneider、Benjamin Paul Rode、和Bjoern Aldag的名义于2006年11月7日提交的在先美国临时专利申请Serial No.60/857379的优先权。
背景技术和发明内容
[0002]因特网及其它计算机网络已成为信息传输的支柱。就此 而言,相关数据存储的有效分析和搜索极为重要。如果自动机器可以 处理包含在口语或书面自然语言中的意义,则计算机技术的许多应用 将被更好地实现并享受提高的稳健性和完整性。以前,由在文档本身 中出现的词条或源自该文档所在的文集、较大文档集或这两者的统计 模型来导出此类解释。
[0003]因此,公开了一种用于产生文本的富含语义的表示的新 型系统和方法,所述系统和方法利用语义模型来放大并加深文本的解 释。这种方法不仅可适用于产生文本的语义表示,而且可适用于匹配 多个文本的表示。所述方法依赖于这样的事实,即存在相当数量的与 大多数文本串相关联的语义内容,其在那些串中或仅仅在该串与其它 串的统计共现中是不明确的,但其仍然与文本极其相关。
[0004]此附加信息可以用来加深直接从文本串导出的表示,而 且还对该表示扩充虽未在该串中明确提及、但在文本中是暗含的、且 如果使其明确则可以用来支持文本处理应用的性能的内容,所述文本 处理应用包括文档标引和检索、文档分类、文档传阅(document routing)、文档综述、以及文档加标签。这些改进还支持下游处理, 诸如自动化文档阅读和理解、在线广告设置、电子商务、企业知识管 理、以及商业和政府智能应用。
附图说明
[0005]阅读以下详细说明时和参考附图时,本发明的前述及其 它优点将变得显而易见,在附图中:
[0006]图1是举例说明其中利用数据存储的语义表示的本发明 的一个实施例的数据流程图;
[0007]图2是举例说明包括对为什么检索文档并访问标记的文 档和原始文档的可用解释的语义搜索结果的数据流程图;
[0008]图3是举例说明依照本发明的实施例的语义解释器的一 个实施例的数据流程图。
[0009]虽然本发明可以接受各种修改和替代形式,但已在附图 中通过举例示出并将在本文中详细描述特定实施例。然而,应理解的 是,本发明并不意图局限于所公开的特定形式。相反,本发明将涵盖 在随附权利要求所限定的本发明的精神和范围内的所有修改、等价 物、以及替代。
具体实施方式
[0010]如上所述,本发明的实施例提供了用于文本的解释、分 析和搜索的基于语义模型的系统和方法。另外,所述模型可以有利地 应用于图示、描述图像的信息、发言记录、音乐唱片的描述信息等等。
[0011]公开了一种用于产生文本的富含语义的表示的新型系统 和方法,所述系统和方法利用语义模型来放大并加深文本的解释。这 种方法不仅可适用于产生文本的语义表示,而且可适用于匹配多个文 本的表示。所述方法依赖于这样的事实,即存在相当数量的与大多数 文本串相关联的语义内容,其在那些串中或仅仅在该串与其它串的统 计共现中不明确,但其仍然与文本极其相关。此附加信息既用来加深 直接从文本串导出的表示,而且还对该表示扩充虽未在该串中明确提 及、但在文本中是暗含的、且如果使其明确则可以用来支持文本处理 应用的性能的内容,所述文本处理应用包括文档标引和检索、文档分 类、文档传阅、基于可以由文档中的特定注解术语(term)或以其它 方式来举例说明的概括性总结的文档综述、文档之间的自动链接、文 档与用文档元特征加标签的文档之间的不一致性的检测,所述元特征 诸如作者的态度或情感倾向、或预定目标读者的性格。然后,可以使 用这些改进来支持下游处理,诸如自动化文档阅读和理解、在线广告 设置、电子商务、企业知识管理、基于信息用户访问或产生的信息的 意义的信息用户之间的合作或社会联网机会的识别、以及商业和政府 智能应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塞科普公司,未经塞科普公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880012107.0/2.html,转载请声明来源钻瓜专利网。