[发明专利]基于知识图谱的风险预测方法、装置、设备及存储介质在审
申请号: | 202011279427.1 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112365171A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 杜翠凤;智海峰;唐荣;周洪林 | 申请(专利权)人: | 广州杰赛科技股份有限公司;广州杰赛通信规划设计院有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06F16/36;G06K9/62;G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510310 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 风险 预测 方法 装置 设备 存储 介质 | ||
本发明公开了一种基于知识图谱的风险预测方法、装置、设备及存储介质,该方法,包括:对数据源的犯罪数据进行关系抽取,获得RDF数据;RDF数据包括若干个实体三元组;根据RDF数据,构建犯罪知识图谱;利用预先构建的图深度学习模型对犯罪知识图谱进行时间相关性分析,获得融合时间相关性特征的犯罪知识图谱;根据融合时间相关性特征的犯罪知识图谱,对预先构建的卷积神经网络进行训练,获得犯罪风险预测模型;根据当前采集的犯罪风险数据,通过犯罪风险预测模型,获得犯罪风险预测结果;通过实体三元组构建犯罪知识图谱,有效挖掘司法案件的实体关系,基于犯罪知识图谱和图深度学习进行风险预测,能有效提高犯罪风险预测的效率和准确性。
技术领域
本发明涉及人工智能的自然语言处理技术领域,尤其涉及一种基于知识图谱的风险预测方法、装置、设备及存储介质。
背景技术
随着我国不断深入推进“智慧司法”建设,中国裁判文书网、中国庭审公开网等平台的相继建成运行,司法公开达到前所未有的广度和深度。而词法领域是一个庞大的知识体系,且领域知识比较复杂,随着司法公开数据的不断增大,数据之间的关系也越来越复杂,目前只能处理简单数据关系的传统关系型数据库已无法胜任,且面向司法案件的风险预测研究比较还是比较匮乏,例如,目前一般只能通过专家知识与人工手段对犯罪风险进行预测分析,风险预效率、准确较低。
发明内容
针对上述问题,本发明的目的在于提供一种基于知识图谱的风险预测方法、装置、设备及存储介质,其能有效挖掘司法案件的实体关系,提高犯罪风险预测的效率和准确性。
第一方面,本发明实施例提供了一种基于知识图谱的风险预测方法,包括:
对数据源的犯罪数据进行关系抽取,获得RDF数据;所述RDF数据包括若干个实体三元组;
根据所述RDF数据,构建犯罪知识图谱;
利用预先构建的图深度学习模型对所述犯罪知识图谱进行时间相关性分析,获得融合时间相关性特征的犯罪知识图谱;
根据融合时间相关性特征的犯罪知识图谱,对预先构建的卷积神经网络进行训练,获得犯罪风险预测模型;
根据当前采集的犯罪风险数据,通过所述犯罪风险预测模型,获得犯罪风险预测结果。
作为上述方案的改进,所述对数据源的犯罪数据进行关系抽取,获得RDF数据,包括:
将所述犯罪数据输入到预先构建的基于BERT-BiLSTM-CRF算法的关系抽取模型进行关系抽取,得到所述RDF数据。
作为上述方案的改进,所述实体三元组包括实体、所述实体的属性及属性值。
作为上述方案的改进,所述方法还包括关系抽取模型构建步骤,具体包括:
将所述数据源的犯罪数据划分为训练样本和测试样本;
将所述训练样本输入BERT模型,获得所述训练样本的词向量;
将所述词向量输入到BiLSTM-CRF模型进行训练,获得关系抽取模型;
利用所述测试样本对所述关系抽取模型进行测试,获得最终的初始关系抽取模型。
作为上述方案的改进,所述方法还包括:
利用K-Means算法对所述犯罪知识图谱的实体进行聚类,得到若干个实体群;
确定待处理的实体所属的实体群,作为候选实体群;
从所述候选实体群中获取与所述待处理的实体距离最近的实体,作为候选实体;
从所述数据源中获取所述候选实体对应的决策数据,作为所述待处理的实体的决策数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州杰赛科技股份有限公司;广州杰赛通信规划设计院有限公司,未经广州杰赛科技股份有限公司;广州杰赛通信规划设计院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011279427.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用型防腐浆料
- 下一篇:一种基于大数据调整NLP模型容量的方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理