[发明专利]一种用于网络社区文本的实体关系图谱构建方法和系统在审
申请号: | 201910277242.8 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110188191A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 吴旭;颉夏青;吴海涛;张熙;方滨兴 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F17/27;G06Q50/00 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种用于网络社区文本的实体关系图谱构建方法和系统,包括:采集网页中的文本,进行实体识别和实体关系抽取,构建语义模型;采集网络社区中的文本,进行实体识别和实体关系抽取,得到网络实体关系集合;使用分类模型对网络实体关系集合进行分类,得到实体对;对所述实体对进行层次分类计算,将实体对融合进语义模型中;对融合后的语义模型进行可视化处理,得到实体关系图谱。使用特定网页中的纯净文本生成语义模型,保证实体关系的准确性和可靠性;使用分类算法和核心实体关系集合训练分类模型,并进行评估,增加了分类的可靠性;将通过评估的网络实体关系集合加进核心语义模型,增加了核心语义模型的丰富性、稳定性和自动扩展性。 | ||
搜索关键词: | 实体关系 关系集合 语义模型 网络社区 网络实体 文本 核心语义 实体识别 图谱构建 抽取 网页 采集 可视化处理 层次分类 分类模型 分类算法 核心实体 文本生成 训练分类 扩展性 融合 分类 构建 评估 图谱 申请 保证 | ||
【主权项】:
1.一种用于网络社区文本的实体关系图谱构建方法,其特征在于,包括:采集网页中的文本;对所述网页中的文本进行实体识别和实体关系抽取,构建语义模型;采集网络社区中的文本;对所述网络社区中的文本进行实体识别和实体关系抽取,得到网络实体关系集合;使用分类模型对网络实体关系集合进行分类,得到实体对;对所述实体对进行层次分类计算,将实体对融合进语义模型中;对融合后的语义模型进行可视化处理,得到实体关系图谱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910277242.8/,转载请声明来源钻瓜专利网。