[发明专利]一种百科词条标签的优化方法及系统有效
申请号: | 201710627612.7 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107247709B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 徐波 | 申请(专利权)人: | 广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/332;G06F16/35 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 百科 词条 标签 优化 方法 系统 | ||
本发明提供一种百科词条标签的优化方法,其包括以下步骤:S1:对百科词条进行判断是否有标签;若有标签,则执行步骤S2;若无标签,则执行步骤S3;S2:对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;S3:获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签。相比于现有技术,本发明可在合适的时间内完成标签优化工作。该方法提高了百科词条的三元组数据的标签的正确性,改善了知识本体库的质量,提高了问答系统回答用户问题的正确性。
技术领域
本发明涉及优化方法,特别是一种百科词条标签的优化方法及系统。
背景技术
知识库,又称为智能数据库或人工智能数据库。知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
知识库有着广泛的应用,典型的应用有智能问答系统或自动问题系统或问答知识库,自动问题系统中存储着一些预设的问题,并存储预设问题对应的答案信息,在公众用户提出问题时,自动问题系统会将公众用户提出的问题与预设的问题进行匹配,若匹配成功,自动问题系统会将该预设问题对应的答案信息反馈给公众用户。
在问答系统领域中,往往需要从百科中抽取结构化数据来扩展知识本体库。所要抽取的结构数据为三元组格式,即词条-词条属性-属性值。为了提高在本体库中搜索词条的速度,需要会利用词条标签对词条进行分类,以缩减搜索词条的范围,同时了解该词条所属领域。但是百科词条经常会有标签错误或无标签的情况。
同时,对于词条有可能会存在多个标签,由于词条标签经常是由网民编辑的,标签质量难以保证。即使是由专业的工作人员编辑词条标签,同样会出现标签质量不高的情况。目前的方法,无法提供更好的优化效果。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供了一种百科词条标签的优化方法及系统。
本发明通过以下的方案实现:一种百科词条标签的优化方法,其包括以下步骤:
S1:对百科词条进行判断是否有标签;若有标签,则执行步骤S2;若无标签,则执行步骤S3;
S2:对有标签的词条按标签正确性作降序排序,排序后的第一个标签作为词条的最佳标签;
S3:获取该无标签词条的属性词的词向量,并分别与有标签的词条的属性词的词向量进行相似度比较,从而在有标签词条中匹配出该无标签词条相似度最大的词条,并将该词条的标签作为无标签词条的标签;
所述步骤S3中具体包括以下步骤:
S31:获得无标签词条的各个属性词的词向量,将所有属性词的向量相加再取平均得到的最终的一个向量;
S32:将该无标签词条的各个属性词的词向量与有标签词条的属性词向量进行相似度比较;
S33:获取有标签的词条中匹配出跟无标签的词条最相近的词条,并把其标签作为无标签的词条的标签;
所述步骤S33中,在有标签的词条中匹配出跟无标签的词条最相近的词条时,具体通过:
遍历全部有标签的词条,并匹配出相似度最大的词条标签;
或着,通过抽取设定数量的有标签的词条,并匹配出相似度最大的词条标签;
或者,通过设定一个相似度阈值,当余弦相似度大于设定的相似度阈值时,则结束匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司,未经广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710627612.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种姓名识别方法及系统
- 下一篇:一种英语翻译机