[发明专利]面向游戏问答系统的知识图谱更新方法、系统及装置在审
| 申请号: | 201910726592.8 | 申请日: | 2019-08-07 |
| 公开(公告)号: | CN110532399A | 公开(公告)日: | 2019-12-03 |
| 发明(设计)人: | 徐波 | 申请(专利权)人: | 广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F16/33;G06F17/27;G06K9/62 |
| 代理公司: | 11411 北京联瑞联丰知识产权代理事务所(普通合伙) | 代理人: | 赵娜<国际申请>=<国际公布>=<进入国 |
| 地址: | 510530 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征词 图谱 同义词 词向量 匹配度 游戏 实体类别 实体类型 问答数据 问答系统 先验知识 训练数据 知识实体 自动更新 泛化性 分词器 无监督 相似度 日志 更新 标注 词语 过滤 筛选 融合 分类 社区 | ||
本发明公开了一种面向游戏问答系统的知识图谱更新方法、系统和装置,收集游戏问答日志和社区问答数据;筛选出和游戏相关的特征词;将特征词加入分词器训练出词向量;使用词向量找出各个特征词与其相似度大于阈值的词语作为该特征词的同类词;计算各个特征词在知识图谱的平均匹配度和分布,过滤非实体词并确定实体词的实体类别;对互为同义词的实体词进行融合;将平均匹配度大于阈值的实体词及其同义词更新到对应的知识图谱。本发明提供了一种无监督的知识实体分类方法,更具有通用性和泛化性,可以识别新出现的实体类型,基于先验知识图谱知识,也无需预先标注训练数据,同时也满足知识图谱自动更新的需求。
技术领域
本发明涉及数据处理技术领域,特别是指一种面向游戏问答系统的知识图谱更新方法、系统及装置。
背景技术
知识图谱是一种图结构表示的知识库,是对知识抽象总结成相互连接的知识体系的一项技术,其结点表示知识实体,可以有具体的属性信息;边表示实体之间的语义关系。知识图谱在人工智能领域有广泛的应用,在问答系统中,它可以让系统定位和理解用户提及的知识,以帮助系统生成准确的回答。知识图谱将文字和知识联系了起来,为问答系统构建了知识体系。
而在游戏领域,问答系统主要有两个功能:
1、基于现实世界观的闲聊或常识型问答;
2、基于游戏世界观的知识或攻略型问答;
游戏世界存在着大量与游戏背景相关的知识,这些知识有的在现实世界中不存在,有的和现实世界知识相冲突,有的随着玩家的交流而产生出特殊的别称。同时,随着游戏版本的迭代和活动更新,会出现一批新的知识。因此,知识图谱需要不断更新知识,这通常需要大量的人力;而为了准确区分出现实世界知识和游戏世界知识,还需要对知识进行消歧处理。
一个较为完整的游戏问答系统不仅需要满足游戏知识问答,还需要支持基于现实世界观的问答或闲聊。同时,如果有多款游戏需要接入同一个游戏问答系统(例如同一公司的多款游戏),则知识图谱数量是随着游戏数量线性增长的。在这样一个具有多个知识图谱的系统环境中,知识图谱的更新要解决以下几个问题:
1、知识图谱的自动化或半自动化更新,以减少人工维护带来的人力成本。
2、多知识图谱环境带来的知识分类问题。知识分类大多是采用有监督训练分类器的方法实现,需要预先标注好一定量的数据集,而有监督的分类器无法对新出现的实体或知识类型进行很好的识别,泛化性较差。
3、知识实体融合。从语料中识别出的词语可能会有指向相同实体的词语,需要筛选出这些同义词,以防止重复构建相同的词语。而在游戏领域,游戏知识的同义词通常由玩家在游戏体验、交流过程中产生,这些词语绝大部分是在先验知识库中没有的,需要从语料中总结收集。而目前常用的实体融合技术通常是在平行知识库的合并的环境下进行的,无法解决上述问题。
发明内容
本发明提出一种面向游戏问答系统的知识图谱更新方法、系统及装置,从问答文本中识别出实体,区分出现实实体和游戏实体并进行自动化更新,以解决问答系统的知识时效性问题,提供准确的回复。
本发明的技术方案是这样实现的:
一种面向游戏问答系统的知识图谱更新方法,包括以下步骤:
S1,收集游戏问答日志和社区问答数据;
S2,从上述语料中筛选出和游戏相关的特征词;
S3,将特征词加入分词器,获得适用于游戏领域文本的分词器,并训练得到词向量;
S4,依据预设定的相似度阈值使用词向量找出各个特征词与其相似度大于阈值的词语作为该特征词的同类词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司,未经广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910726592.8/2.html,转载请声明来源钻瓜专利网。





