[发明专利]一种基于多层级多维度语义理解的法律认知方法、装置和介质有效
申请号: | 201710475332.9 | 申请日: | 2017-06-21 |
公开(公告)号: | CN108073569B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 李东海;黄晓宏 | 申请(专利权)人: | 北京华宇元典信息服务有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/289;G06F40/211;G06F40/30;G06Q50/18 |
代理公司: | 北京彩和律师事务所 11688 | 代理人: | 闫桑田 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 多维 语义 理解 法律 认知 方法 装置 介质 | ||
本发明涉及一种利用人工智能领域的机器学习技术,通过多层级和多维度语义理解法律知识,属于人工智能领域。本发明所涉及的方法、装置和计算机可读介质,对法律文本内容进行预处理获得法律文本信息,基于相似词语模型、相似短语模型和相似长句模型,生成语义概念聚合以构建语义理解模块,基于法律属性抽取模型生成法律属性和法律规则,以构建法律规则模块,语义理解模块和/或法律规则构建模块识别所述法律文本信息并生成法律知识图谱。对法律文本中的自然语言进行深度理解,扩展了人工智能法律知识的处理能力。
技术领域
本发明涉及一种利用人工智能领域的智能语义理解和处理,属于人工智能领域。
背景技术
自然语言处理(natural language processing,简称NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。对于自然语言理解,特别是语义理解方面,从现有的理论和技术现状看,部分的自然语言处理系统,特别是针对特定业务需求的自然语言处理和理解系统,虽然具备了一定的实用性,但是在法律文本的自然语言处理领域,尚无成熟的、专业的技术成果和商业应用。
就法律自然语言理解而言,其主要问题包括几方面:
一是缺少针对法律领域的大规模真实语料库的研制,以及专业性强的丰富的法律词典的编制。如对于法律专业的“无因管理”、“不当得利”以及特定的案由、罪名等,通用的分词等技术是无法满足实际应用需求的。
二是对法律文本的基本属性、特征、规则研究不足,导致对包括裁判文书、检察文书、诉状与答辩意见、证据材料等在内的各类文本进行信息抽取和分析效果不佳。
三是目前的语义理解能力,主要集中在对相似的法律词语的理解上。在短语、语句层面的理解效果上还有不足,导致无法实现从字面涵义到法律涵义的转换,更无法对纷繁复杂的案件自然事实、情节、证据进行统一认知和扩展。
举例来说,裁判文书会区分为刑事、民事、行政、执行等各类案件类型,同时也会区分一审、二审、再审等各类审判程序,并且根据判决、裁定、调解文书来看,其文书结构和段落等也会有有较多的差别。只有精准的识别了相应的属性,我们才有可能更好地做相应的信息抽取和语义理解。如到公安机关投案这个事实,在法律认知上属于自首的一个具体情形。再如对于入户盗窃中关于“户”的理解,也需要结合具体语境或者实际情况来实现统一的认知,从而扩展我们的知识。
发明内容
为了解决上述存在的技术问题,本发明提出了一种基于多层级多维度语义理解的法律认知方法、装置、系统和介质。本发明提出的技术方案与法律知识图谱技术相结合,通过在语义理解过程中的改进,辅助实现从案情数据输入,到最终对用户有价值的法律知识输出的全智能的应用过程。
本发明提出一种基于多层级和多维度语义理解的法律认知方法,包括,
步骤1:对法律文本内容进行预处理,获得法律文本信息;
步骤2:基于相似词语模型、相似短语模型和相似长句模型,生成语义概念聚合以构建语义理解模块;
步骤3:基于法律属性抽取模型生成法律属性和法律规则,以构建法律规则模块;
步骤4:所述语义理解模块和/或法律规则构建模块识别所述法律文本信息并生成法律知识图谱。
根据本发明的一实施例,所述法律规则模型调用法律法规库以优化法律规则模型。
根据本发明的一实施例,所述词语聚类处理包括对每个词设置一个词向量,利用神经网络训练语言模型对词向量进行训练,通过文本统计出词频、词的共现、词的搭配,调整词向量的值,并自我学习生成新的词向量,自动标注所述法律文本信息,并通过比较词向量的距离,实现语义概念的聚合。
根据本发明的一实施例,对所述获得的法律文本信息的词语进行组合,并通过加权计算,生成文本向量矩阵,对法律短语和法律语句进行相似处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华宇元典信息服务有限公司,未经北京华宇元典信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710475332.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:关键词提取方法和装置
- 下一篇:一种基于隐马尔可夫模型的词义消歧方法