[发明专利]争议焦点类别及相似判断方法及系统及装置及推荐方法有效

专利信息
申请号: 202110608911.2 申请日: 2021-06-01
公开(公告)号: CN113468323B 公开(公告)日: 2023-07-18
发明(设计)人: 请求不公布姓名;请求不公布姓名;请求不公布姓名;请求不公布姓名;李鑫;翁洋;王竹;请求不公布姓名 申请(专利权)人: 成都数之联科技股份有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/332;G06F40/30;G06F18/214
代理公司: 暂无信息 代理人: 暂无信息
地址: 610041 四川省成都市*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 争议 焦点 类别 相似 判断 方法 系统 装置 推荐
【权利要求书】:

1.争议焦点类别判断方法,其特征在于,所述方法包括:

从裁判文书数据中抽取得到第一争议焦点语句数据,将所述第一争议焦点语句数据标注争议焦点类别得到第二争议焦点语句数据;

基于所述第二争议焦点语句数据构造召回数据集,所述召回数据集中数据元素的结构为:(争议焦点语句a,a的争议类别);

基于所述第二争议焦点语句数据构造精排数据集,所述精排数据集中数据元素的结构为:((争议焦点语句a,a对应的相似争议焦点语句),(争议焦点语句a,a对应的困难样本争议焦点语句));

构造第一召回模型和第一精排模型,利用所述召回数据集训练所述第一召回模型得到第二召回模型,利用所述精排数据集训练所述第一精排模型得到第二精排模型;

得到争议焦点类别待判断的争议焦点语句X,将所述争议焦点语句X输入所述第二召回模型,所述第二召回模型输出所述争议焦点语句X的topN争议焦点类别标签,N为大于或等于1的整数;将争议焦点语句X-topN类别对应的争议焦点语句输入所述第二精排模型,所述第二精排模型输出所述争议焦点语句X的争议焦点类别;

所述第二精排模型得到所述争议焦点语句X与topN争议焦点类别对应的争议焦点语句的第一相似度,将所有所述第一相似度按照topN争议焦点类别分组,并求各分组中所述第一相似度的平均值,所述平均值为所述争议焦点语句X对应争议焦点类别与topN争议焦点类别的第二相似度,选取所述第二相似度最高的类别作为所述争议焦点语句X的争议焦点类别;

所述召回模型为使用预训练语言模型Bert做微调得到的基于Bert的多分类模型;

所述精排模型为Bert-BasedSiameseNetwork,所述精排模型的损失函数为triplet_loss,所述精排模型训练时采用对抗训练方式;

所述精排模型每次训练在做前向传播和梯度更新之前,先对Bert模型的标记嵌入做扰动处理,扰动的向量为损失函数对标记嵌入的梯度,将该扰动向量加到标记嵌入上,然后做前向传播和后向梯度更新,将扰动向量从标记嵌入上减掉,从而进入到下一次迭代训练。

2.根据权利要求1所述的争议焦点类别判断方法,其特征在于,与争议焦点语句a最相似的topK争议焦点语句的提取方式为:

从抽取得到的所有争议焦点语句类别中剔除争议焦点语句a对应类别后获得剩余争议焦点语句类别;

从所述剩余争议焦点语句类别对应的争议焦点语句中筛选出第一部分争议焦点语句;

使用TF-IDF算法从所述第一部分争议焦点语句中匹配出与所述争议焦点语句a最相似的topK争议焦点语句。

3.争议焦点相似性判断方法,其特征在于,所述方法包括:

得到相似性待判断的第一争议焦点语句与第二争议焦点语句;

使用权利要求1-2中的任意一种所述争议焦点类别判断方法分别得到所述第一争议焦点语句的争议焦点类别和所述第二争议焦点语句的争议焦点类别;

若所述第一争议焦点语句的争议焦点类别与所述第二争议焦点语句的争议焦点类别相同,则判断所述第一争议焦点语句与所述第二争议焦点语句相似;

若所述第一争议焦点语句的争议焦点类别与所述第二争议焦点语句的争议类别不同,则判断所述第一争议焦点语句与所述第二争议焦点语句不相似。

4.类案推荐方法,其特征在于,所述方法包括:

得到待处理案件A的争议焦点语句m;

采用权利要求3所述的争议焦点相似性判断方法从争议焦点语句数据库中匹配出与所述争议焦点语句m相似的若干第三争议焦点语句;

基于所述第三争议焦点语句得到若干与所述待处理案件A相似的案件B,将所述案件B推送至预设目标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数之联科技股份有限公司,未经成都数之联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110608911.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top