[发明专利]概念识别设备和方法有效
| 申请号: | 201110077605.7 | 申请日: | 2011-03-18 |
| 公开(公告)号: | CN102682042A | 公开(公告)日: | 2012-09-19 |
| 发明(设计)人: | 李建强;赵彧;刘博 | 申请(专利权)人: | 日电(中国)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 潘剑颖 |
| 地址: | 100191 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 概念 识别 设备 方法 | ||
1.一种概念识别设备,包括:
概念匹配单元,对文档中的概念进行初步匹配,产生具有可信度分数的候选概念;
概念分类单元,将概念匹配单元产生的候选概念按照其可信度分数归类为高可信度概念集合和低可信度概念集合;以及
概念匹配改进单元,利用高可信度概念集合中的元素对低可信度概念集合中的元素执行消除歧义处理。
2.根据权利要求1所述的概念识别设备,其中,所述概念匹配单元将文档分成多个块,并且参照概念本体对每一个块进行匹配,以产生具有可信度分数的候选概念。
3.根据权利要求1所述的概念识别设备,其中,所述概念匹配单元使窗口在文档中的文本上滑动,然后通过对窗口中所包含的词或者词组以及概念本体中的每个概念所包含的词或者词组进行比对而获得对窗口的评分,以产生具有可信度分数的候选概念。
4.根据权利要求1所述的概念识别设备,其中,所述概念分类单元通过设定可信度分数阈值,把具有高于所述阈值的可信度分数的概念归类到高可信度概念集合中,而把具有低于所述阈值的可信度分数的概念归类到低可信度概念集合中。
5.根据权利要求1所述的概念识别设备,其中,所述概念分类单元通过设定百分数阈值t%并且按照可信度分数的高低对所有候选概念进行排序,把所有候选概念中具有属于前t%的可信度分数的概念归类到高可信度概念集合中,而把余下的概念归类到低可信度概念集合中。
6.根据权利要求1所述的概念识别设备,其中,所述概念匹配改进单元执行如下操作:选择高可信度概念集合中的高可信度概念子集作为特定的低可信度概念的上下文概念,利用所述上下文概念重新计算所述特定的低可信度概念的可信度分数,并且基于重新计算的可信度分数把所述特定的低可信度概念重新归类到高可信度概念集合或低可信度概念集合中。
7.根据权利要求6所述的概念识别设备,其中,所述概念匹配改进单元按照迭代的方式执行所述操作,直到低可信度概念集合中的元素不再发生变化为止。
8.根据权利要求6所述的概念识别设备,其中,所述概念匹配改进单元按照迭代的方式执行所述操作预定次数。
9.一种概念识别方法,包括:
对文档中的概念进行初步匹配,产生具有可信度分数的候选概念;
将概念匹配单元产生的候选概念按照其可信度分数归类为高可信度概念集合和低可信度概念集合;以及
利用高可信度概念集合中的元素对低可信度概念集合中的元素执行消除歧义处理。
10.根据权利要求9所述的概念识别方法,其中,通过将文档分成多个块并参照概念本体对每一个块进行匹配,来产生具有可信度分数的候选概念。
11.根据权利要求9所述的概念识别方法,其中,通过使窗口在文档中的文本上滑动,然后通过对窗口中所包含的词或词组与概念本体中每个概念所包含的词或者词组进行比对而获得对窗口的评分,来产生具有可信度分数的候选概念。
12.根据权利要求9所述的概念识别方法,其中,通过设定可信度分数阈值,把具有高于所述阈值的可信度分数的概念归类到高可信度概念集合中,而把具有低于所述阈值的可信度分数的概念归类到低可信度概念集合中。
13.根据权利要求9所述的概念识别方法,其中,通过设定百分数阈值t%并按照可信度分数的高低对所有候选概念进行排序,把所有候选概念中具有属于前t%的可信度分数的概念归类到高可信度概念集合中,而把余下的概念归类到低可信度概念集合中。
14.根据权利要求9所述的概念识别方法,其中,所述消除歧义处理包括如下操作:选择高可信度概念集合中的高可信度概念子集作为特定的低可信度概念的上下文概念,利用所述上下文概念重新计算所述特定的低可信度概念的可信度分数,并且基于重新计算的可信度分数把所述特定的低可信度概念重新归类到高可信度概念集合或低可信度概念集合中。
15.根据权利要求14所述的概念识别方法,其中,按照迭代的方式执行所述消除歧义处理,直到低可信度概念集合中的元素不再发生变化为止。
16.根据权利要求14所述的概念识别方法,其中,按照迭代的方式执行所述消除歧义处理预定次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110077605.7/1.html,转载请声明来源钻瓜专利网。





