[发明专利]一种业务处理方法和装置在审
申请号: | 202210419977.1 | 申请日: | 2022-04-21 |
公开(公告)号: | CN114817349A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 朱俊衡;贾国琛;郭赜;李萌 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/242;G06F40/284 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 郝红玉;张春晓 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 处理 方法 装置 | ||
本发明公开了一种业务处理方法和装置,涉及自然语言处理领域。该方法的一具体实施方式包括:响应于对目标用户的选择操作,获取与目标用户的标识对应的业务事项名称集;计算业务事项名称集中每个业务事项名称和其他业务事项名称的相似度,筛选相似度超过预设相似度阈值的相似业务事项名称;提取每个业务事项名称和相似业务事项名称的重合语料,对重合语料做拆分去重处理得到目标语料,将目标语料作为每个业务事项名称的用户标签;统计所有业务事项名称的用户标签,以基于所得用户标签进行相应业务处理操作。该实施方式仅需获取用户办理具体业务事项的记录,使用的算法的复杂度较低,不存在技术实现的门槛,以此形成一套独特的标签加工体系。
技术领域
本发明涉及人工智能领域中的自然语言处理领域,尤其涉及一种业务处理方法和装置。
背景技术
近年来大数据建设进入了崭新的阶段,从传统行业到互联网企业,从实体商品到金融服务,基于大数据的服务层出不穷,但大多数企业存在数据量少、数据来源单一、数据维度不够丰富的问题。且随着数据监管力度的不断收紧,数据的安全合规性也逐渐被重视,使得数据流动的难度大大增加。另外,涉及企业核心价值的数据或者政务相关数据,也难以做到开放和分享。
为了释放海量数据的价值,对用户行为数据的挖掘成为了一个重要方向,用户行为数据一方面来自用户在各种应用程序的点击和申请记录,另一方面来自事项办理系统。基于用户事项办理数据的挖掘目前仍停留在用户行为序列的维度,并没有针对于事项蕴含的内容和属性进行挖掘,因而无法构建代表用户属性的标签。
发明内容
有鉴于此,本发明实施例提供一种业务处理方法和装置,至少能够解决现有技术没有针对事项蕴含的内容和属性进行挖掘,因而无法加工形成代表用户属性的标签的现象。
为实现上述目的,根据本发明实施例的一个方面,提供了一种业务处理方法,包括:
响应于对目标用户的选择操作,获取与所述目标用户的标识对应的业务事项名称集;
计算所述业务事项名称集中每个业务事项名称和其他业务事项名称的相似度,筛选相似度超过预设相似度阈值的相似业务事项名称;
提取所述每个业务事项名称和所述相似业务事项名称的重合语料,对所述重合语料做拆分去重处理得到目标语料,将所述目标语料作为所述每个业务事项名称的用户标签;
统计所有业务事项名称的用户标签,以基于所得用户标签进行相应业务处理操作。
可选的,在所述获取与所述目标用户的标识对应的业务事项名称集之后,还包括:
通过预设非常规信息表,去除每个业务事项名称中的非常规信息;以及
对去除非常规信息后的业务事项名称做去重处理。
可选的,还包括:
对每个业务事项名称做分词处理,基于预设停用词库去除分词中的停用词;其中,停用词为与用户属性无关的词语;
对于剩余词语统计位于预设位置的词语的词频,按照词频从大到小的顺序,选取排序靠前的预设数量个词语以构建业务动词库;
在所述提取所述每个业务事项名称和所述相似业务事项名称的重合语料之后,还包括:基于所述业务动词库,对重合预料做去除业务动词操作,得到更新后的重合预料。
可选的,在所述基于所得用户标签进行相应业务处理操作之前,还包括:
基于所述业务动词库,筛选包括预设业务动词的第一业务事项名称,确定所述第一业务事项名称的第一用户标签;
从与所述目标用户对应的业务事项名称集中,筛选出与所述第一用户标签对应的所有业务事项名称,以从中确定办理时间最新的第二业务事项名称;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210419977.1/2.html,转载请声明来源钻瓜专利网。