[发明专利]一种利益冲突检索的方法有效
申请号: | 202210019214.8 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114610841B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 周建波;张杰;吕勋;韩爱生 | 申请(专利权)人: | 杭州新中大科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06F40/289;G06F18/214 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 岳晓萍 |
地址: | 310000 浙江省杭州市拱墅*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利益冲突 检索 方法 | ||
1.一种利益冲突检索的方法,其特征在于,包括以下步骤:
S1:立案阶段,用户发起利益冲突检索请求;
S2:根据检索请求,在工商信息库中读取待检索对象的历史工商信息;历史工商信息包括历史名称和从属关联企业;
S3:通过利益冲突关键字截取器自动截取利益冲突检索需求关键字,进行检索数据源参数整理;
S4:根据预设的利益冲突检索规则生成检索任务,分别在利益冲突业务库、利益冲突重点客户及关联企业库和利益冲突敏感库三个检索数据库中并行进行正向、反向、同向和异向利益冲突的组合检索,并分别合并检索结果后输出;
S5:将三个检索数据库输出的检索结果合并后返回;
其中,所述的利益冲突关键字截取器的截取和自学习过程如下:
A1:创建初始语料库;
A2:从初始语料库以及历史利益冲突检索处理结果中划分训练集、验证集,构建截取模型;
A3:使用条件随机场算法,以待检索对象名称X作为输入,以利益冲突关键词Y作为输出,计算线性链条件随机场P(Y|X);
A4:采用维特比算法,获取所有结果准确性最大化的输出利益冲突关键词y;
其中,利益冲突的检索逻辑具体为:
B1:为利益冲突的三个检索库进行分词,依次进行建立分词、建立分词向量和建立索引字典;
B2:使用向量检索,对于给定的向量q,其在数据集上的H个近邻为N,通过检索召回的H个近邻集合为M,则
B3:根据利益冲突检索规则器中预设的利益冲突检索规则内容进行匹配检索;
B4:使用DFP校正优化算法,利用数据的关联关系,计算支持度、可信度,得到频繁项集,进而对于数据匹配逻辑进行优化;
B5:在三个检索数据库中并行进行正向、反向、同向和异向利益冲突的组合检索。
2.根据权利要求1所述的一种利益冲突检索的方法,其特征在于,在给定X的取值x的情况下,随机变量Y取值为y的条件概率表达为:
Z(x)=∑ψx(R)
其中,Z(x)为归一化因子;
ψx为定义为指数函数的势函数,R为随机变量;
i表示当前位置下标;
tk()表示相邻两个输出间的关系,是转移特征函数,取值{0,1},1为满足特征,0为不满足特征;
sl()表示当前位置的特征,是状态特征函数,取值{0,1};
γk为特征函数tk()对应的权值;
μl为特征函数sl()对应的权值;
k表示转移特征t的个数;
l表示状态特征s的个数。
3.根据权利要求2所述的一种利益冲突检索的方法,其特征在于,所述的维特比算法表示为:
其中,F(y,x)为模型特征向量,ω为权值向量:
Fj(yi-1,yi,x)=(f1(yi-1,yi,x,i),f2(yi-1,yi,x,i),...,fK(yi-1,yi,x,i))T。
4.根据权利要求1所述的一种利益冲突检索的方法,其特征在于,在利益冲突业务库中进行同向利益冲突检索和异向利益冲突,并合并检索结果;
在利益冲突重点客户及关联企业库中进行正向同向利益冲突检索、正向异向利益冲突检索、反向同向利益冲突检索和反向异向利益冲突检索,并合并检索结果;
在利益冲突敏感库中进行正向同向利益冲突检索、正向异向利益冲突检索、反向同向利益冲突检索和反向异向利益冲突检索,并合并检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州新中大科技股份有限公司,未经杭州新中大科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210019214.8/1.html,转载请声明来源钻瓜专利网。