[发明专利]一种基于复合投票机制的类案推送方法及装置在审
申请号: | 202210065479.1 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114416965A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 梁鸿翔 | 申请(专利权)人: | 北京北大英华科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F40/194;G06F40/289;G06F40/30;G06F16/35;G06N3/04;G06N3/08;G06Q50/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引 |
地址: | 100080 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复合 投票 机制 推送 方法 装置 | ||
本申请公开了一种基于复合投票机制的类案推送方法及装置,将信息网络输入至预设的非监督学习模型中,得到与案情描述之间的相似度大于预设阈值的多个裁判文书。将案情描述的文本嵌入矩阵,输入至监督学习模型中,得到案情描述的罪名。将与案情描述之间的相似度大于预设阈值的多个裁判文书、以及案情描述的罪名,作为投票机制的参考依据,并利用投票机制从各个裁判文书中选取出目标裁判文书,作为对外推送的裁判文书。将非监督学习模型的输出结果(即与案情描述之间的相似度大于预设阈值的多个裁判文书)、以及监督学习模型的输出结果,作为投票机制的参考依据,并利用投票机制从各个裁判文书中选取出目标裁判文书,能显著提高类案推送的准确性。
技术领域
本申请涉及机器学习技术领域,尤其涉及一种基于复合投票机制的类案推送方法及装置。
背景技术
在智能革命时代背景下,智慧司法的建设正如火如荼地进行,并已取得阶段性进展。与此同时,如何对司法系统中的海量案例进行语义检索并有效地利用,已经成为了智慧司法研究和计算法学研究的共识。类案推送作为智慧司法领域的核心应用,受到广泛关注。
目前,传统的类案推送方法为:统计案情描述中各词项的出现频度,以词频信息为基础,基于词频-逆文档频率(Term Frequency-Inverse Document Frequency,简称TF-IDF),计算案情描述与裁判文书之间的相似度,并向外推送相似度较高的多个裁判文书,作为案情描述的裁判依据。然而,传统的类案推送方法,其各个裁判文书与案情描述之间的相似度计算结果的准确性较低,使得类案推送的准确性大大降低。
发明内容
本申请提供了一种基于复合投票机制的类案推送方法及装置,目的在于提高类案推送的准确性。
为了实现上述目的,本申请提供了以下技术方案:
一种基于复合投票机制的类案推送方法,包括:
将信息网络输入至预设的非监督学习模型中,得到与案情描述之间的相似度大于预设阈值的多个裁判文书;所述信息网络基于所述案情描述、所述裁判文书、以及案件实体之间的关联关系预先构建;所述关联关系基于预设的文本嵌入模型对所述案前描述、以及所述裁判文书进行案件实体识别得到;
将所述案情描述的文本嵌入矩阵,输入至监督学习模型中,得到所述案情描述的罪名;所述监督学习模型基于样本裁判文书的文本嵌入矩阵预先训练得到;所述案情描述的文本嵌入矩阵,基于所述文本嵌入模型对所述案情描述进行文本嵌入矩阵化得到;
将所述与案情描述之间的相似度大于预设阈值的多个裁判文书、以及所述案情描述的罪名,作为投票机制的参考依据,并利用所述投票机制从各个所述裁判文书中选取出目标裁判文书,作为对外推送的裁判文书。
可选的,所述利用所述投票机制从各个所述裁判文书中选取出目标裁判文书,作为对外推送的裁判文书,包括:
所述投票机制,用于:
预先统计各个所述裁判文书的罪名,得到罪名序列;其中,所述罪名序列中的各项罪名,依据所包含的裁判文书的数量从多到少的顺序进行排序;
在所述案情描述的罪名位于所述罪名序列的前m位,且位于所述罪名序列中第一序位的罪名所包含的裁判文书的数量大于预设数值的情况下,按照所述裁判文书与所述案情描述之间的相似度从高到低的顺序,对所述第一序位的罪名所包含的多个裁判文书进行排序,得到第一文书序列,并将所述第一文书序列中前k位的裁判文书,作为目标裁判文书;其中,m和k均为正整数。
可选的,还包括:
所述投票机制,还用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大英华科技有限公司,未经北京北大英华科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210065479.1/2.html,转载请声明来源钻瓜专利网。