[发明专利]一种聚合信息的方法和装置有效
申请号: | 201210018940.4 | 申请日: | 2012-01-20 |
公开(公告)号: | CN103218372B | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 周均扬;黄波 | 申请(专利权)人: | 华为终端有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 鞠永善 |
地址: | 518129 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种聚合信息的方法和装置,属于信息识别领域。所述方法包括获取待聚合的文本;获取所述文本中信息量的位置标签;根据所述位置标签,计算每两个信息量之间的距离;当第一距离和第二距离相等时,根据语法结构修正所述第一距离和第二距离,其中,所述第一距离为所述信息量中第一信息量与第二信息量之间的距离,所述第二距离为所述信息量中所述第一信息量与第三信息量之间的距离;将所述信息量根据所述修正后的第一距离、第二距离进行聚合,获得结构体。该装置包括文本获取模块、位置标签获取模块、计算模块、修正模块和聚合模块。 | ||
搜索关键词: | 一种 聚合 信息 方法 装置 | ||
【主权项】:
一种聚合信息的方法,其特征在于,所述方法包括:获取待聚合的文本;获取所述文本中信息量的位置标签;根据所述位置标签,计算每两个信息量之间的距离;当第一距离和第二距离相等时,根据语法结构修正所述第一距离和第二距离,其中,所述第一距离为所述信息量中第一信息量与第二信息量之间的距离,所述第二距离为所述信息量中所述第一信息量与第三信息量之间的距离;根据所述修正后的第一距离、第二距离对所述第一信息量、所述第二信息量及所述第三信息量中的两个信息量进行聚合,获得结构体;计算每两个信息量之间的距离的计算公式为:距离=|L(x)‑L(y)|,其中,L(x)和L(y)分别为信息量x的位置标签数值和信息量y的位置标签数值;所述位置标签数值的计算公式为:位置标签数值=段落位置×段落最大字符数+(起始位置+结束位置)/2,其中,所述段落位置是信息量在文本中的自然段落位置,所述起始位置为信息量在文本中的起始位置,所述结束位置为信息量在文本中的结束位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端有限公司,未经华为终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210018940.4/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置