[发明专利]基于开放知识库的短文本语义概念自动化扩展方法及系统有效
申请号: | 201310081984.6 | 申请日: | 2013-03-14 |
公开(公告)号: | CN103150382A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 程学旗;刘盛华;肖永磊;王元卓;刘悦 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于开放知识库的短文本语义概念自动化扩展方法,所述方法将每条短文本生成的n-gram集合中的每个元素链接到开放知识库中与该元素最相关的概念,并且基于开放知识库的概念关系矩阵和所链接的概念,为该元素生成扩展的语义概念集合。该方法仅采用开放知识库文档中的锚文本信息而不采用文档的词项信息和目录信息来构建概念关系矩阵,这使得该矩阵的构造和计算方便,而且克服了目录信息粒度比较粗,歧义多的问题。而且在语义概念扩展阶段,采用基于上下文的语义相似度计算方法来进行语义概念扩展,同时考虑了短文本内容的上下文内容的一致性和概念在抽象语义层的相似性,提高了语义概念扩展的准确性。 | ||
搜索关键词: | 基于 开放 知识库 文本 语义 概念 自动化 扩展 方法 系统 | ||
【主权项】:
一种基于开放知识库的短文本语义概念自动化扩展方法,所述方法包括:步骤1)对短文本生成n‑gram集合;步骤2)对于所述n‑gram集合中的元素执行下列操作:将该元素链接到开放知识库中与该元素最相关的概念,以及基于开放知识库的概念关系矩阵和所链接的概念,为该元素生成扩展的语义概念集合,其中,所述开放知识库的概念关系矩阵的行为该开放知识库中的概念,列为该开放知识库中的文档,所述概念关系矩阵中元素的值为所在行的概念在所在列的文档中出现的总的次数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310081984.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种线路压变谐波抑制装置
- 下一篇:一种母线残压保持装置