[发明专利]一种城市知识图谱构建方法及装置有效
申请号: | 201710150462.5 | 申请日: | 2017-03-14 |
公开(公告)号: | CN106934032B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 叶毓平;曾启文;王虹超 | 申请(专利权)人: | 北京软通智城科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种城市知识图谱构建方法及装置,该方法包括:对城市数据语料进行分词,得到至少一个词组;构建各个词组对应的特征向量;根据各个词组对应的特征向量以及预先生成的城市实体识别模型,对各个词组进行实体识别,并对识别出的各个实体添加属性标签;依据各个词组对应的特征向量以及预先生成的城市实体关系识别模型,对各个实体进行实体关系识别,得到各个实体之间的实体关系信息;根据各个实体、其属性标签以及各个实体之间的关系信息构建城市知识图谱。这就解决了现有的利用浅层学习方法或者模式匹配方法不便于对智慧城市体系内容的扩充,也就不能为城市规划者提供直观参考的问题。 | ||
搜索关键词: | 一种 城市 知识 图谱 构建 方法 装置 | ||
【主权项】:
1.一种城市知识图谱构建方法,其特征在于,包括:对城市数据语料进行分词,得到至少一个词组;针对各个所述词组,提取特征并构建对应的特征向量;根据各个所述词组对应的所述特征向量以及预先生成的城市实体识别模型,对各个所述词组进行实体识别,并为识别出的各个实体添加属性标签;依据各个所述实体对应的所述特征向量以及预先生成的城市实体关系识别模型,对各个所述实体进行实体关系识别,得到各个所述实体之间的实体关系信息;根据各个所述实体、各个所述实体对应的所述属性标签以及各个所述实体之间的所述实体关系信息,构建城市知识图谱;其中,所述预先生成城市实体识别模型的具体过程,包括:对城市数据实体训练语料进行分词,得到至少一个实体训练词组;针对各个所述实体训练词组,提取特征并构建对应的实体训练特征向量;将各个所述实体训练特征向量作为用于识别城市实体的第一初始深度置信网络的输入数据,并对所述第一初始深度置信网络进行逐层无监督预训练,所述第一初始深度置信网络由至少一个受限玻尔兹曼机层堆叠而成;在预训练后的所述第一初始深度置信网络中添加一个神经网络层作为输出层,得到第一深度置信网络;根据各个所述实体训练特征向量对应的标准实体标注,反向微调所述第一深度置信网络各层的实体识别参数;将反向微调后的所述第一深度置信网络确定为城市实体识别模型;所述预先生成城市实体关系识别模型的具体过程,包括:对城市数据实体关系训练语料进行分词,得到至少一个实体关系训练词组;针对各个所述实体关系训练词组,提取特征并构建对应的实体关系训练特征向量;将各个所述实体关系训练特征向量作为用于识别城市实体关系的第二初始深度置信网络的输入数据,并对所述第二初始深度置信网络进行逐层无监督预训练,所述第二初始深度置信网络由至少一个受限玻尔兹曼机层堆叠而成;在预训练后的所述第二初始深度置信网络中添加一个神经网络层作为输出层,得到第二深度置信网络;根据各个所述实体关系训练特征向量之间的标准实体关系标注,反向微调所述第二深度置信网络各层的实体关系识别参数;将反向微调后的所述第二深度置信网络确定为城市实体关系识别模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京软通智城科技有限公司,未经北京软通智城科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710150462.5/,转载请声明来源钻瓜专利网。