[发明专利]利用语句的加权流行数据来管理文档的方法与系统无效
申请号: | 201110360030.X | 申请日: | 2011-11-15 |
公开(公告)号: | CN102567455A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | F·A·库拉克;K·G·帕特森;J·E·派特里 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 邹姗姗 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 语句 加权 流行 数据 管理 文档 方法 系统 | ||
技术领域
本发明的实施方式总体上涉及计算机系统,更特别地涉及执行对文档中语句的语义处理的计算机系统。
背景技术
计算机系统一般包括计算机程序和硬件的组合,其中硬件例如半导体、晶体管、芯片、电路板、存储设备和处理器。计算机程序存储在存储设备中并且由处理器执行。从根本上讲,计算机系统用于存储、操纵和分析数据。
两种不同类型的数据是结构化数据和非结构化数据。结构化数据具有描述数据格式并且有助于赋予数据意义的数据模型、数据模式(schema)或者数据结构。结构化数据的一个例子是具有记录和字段的数据库,例如具有名称字段、地址字段和电话号码字段的记录。字段描述记录的组织并且有助于赋予存储在记录中的数据意义。非结构化数据不具有数据模型或者是具有不容易使用的数据模型。非结构化数据的例子包括文档,例如字处理文档、电子邮件、文章或者文件,其包含文本、散文或者可以转换成文本的音频演讲。存在专门的工具来找出非结构化数据中的模式、解释非结构化数据、对非结构化数据分配意义或者给出非结构化数据的结构。一个这种工具是可以从国际商用机器公司获得的非结构化信息管理体系结构(UIMA)架构,这个工具提供了用于处理非结构化信息以便从非结构化信息提取意义并创建结构化数据的公共架构。
发明内容
提供了方法、计算机可读存储介质和计算机系统。在一种实施方式中,针对相应语句中的相应关系确定相应的强度。与自相应语句添加到文档时起的相应时间量成比例地减小用于相应语句的权值(weight)。针对文档子集中修改过的语句子集增加权值。针对相应语句在相应的时间段上计算加权流行(prevalence)数据,作为针对具有相应强度的所述相应语句在时间段内用于那些语句的权值之和。
附图说明
图1绘出了用于实现本发明实施方式的示例系统的高级框图。
图2绘出了根据本发明实施方式的显示流行图的用户I/O设备的框图。
图3绘出了根据本发明实施方式的用于主题数据的示例数据结构的框图。
图4绘出了根据本发明实施方式的用于权值数据的示例数据结构的框图。
图5绘出了根据本发明实施方式的用于流行数据的示例数据结构的框图。
图6绘出了根据本发明实施方式的用于创建主题数据的示例处理的流程图。
图7绘出了根据本发明实施方式的用于更新权值数据和主题数据的示例处理的流程图。
图8绘出了根据本发明实施方式的用于创建流行数据的示例处理的流程图。
然而,应当指出,附图仅仅例示了本发明的示例实施方式,因此不应当认为是对本发明其它实施方式的范围的限制。
具体实施方式
参考附图,其中贯穿若干视图类似的编号都指示类似的部件,图1绘出了根据本发明实施方式的经网络130连接到客户端计算机系统132的服务器计算机系统100的高级框图表示。在此使用术语“服务器”仅仅是为了方便,而且在各种实施方式中,在一种环境下作为客户端计算机运作的计算机系统在另一种环境下可以作为服务器计算机运作,反之亦然。本发明实施方式的机制和装置同样适用于任何合适的计算系统。
计算机系统100的主要部件包括一个或多个处理器101、主存储器102、终端接口111、存储接口112、I/O(输入/输出)设备接口113和网络适配器114,所有这些部件都经存储器总线103、I/O总线104和I/O总线接口单元105直接或者间接地通信耦合用于部件间的通信。计算机系统100包含一个或多个通用可编程中央处理单元(CPU)101A、101B、101C和101D,在这里一般地称为处理器101。在一种实施方式中,计算机系统100包含一般为相对大系统的多个处理器;然而,在另一种实施方式中,计算机系统100可以另选地是单CPU系统。每个处理器101执行存储在主存储器102中的指令并且可以包括一级或者多级板上高速缓冲存储器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110360030.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于图像信号处理的溢出控制技术
- 下一篇:无线通信系统中的方法和装置