[发明专利]一种电子文件的智能派发方法及装置有效
申请号: | 201810901835.2 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109189883B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 张帆;霍雨佳;林雪南;韩春阳 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06Q10/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛;刘淼 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 文件 智能 派发 方法 装置 | ||
本发明提供了一种电子文件的智能派发方法及装置,涉及电子文件处理技术领域。方法包括:获得各历史电子文件内容作为机器学习样本;对每一历史电子文件内容通过自然语言处理分词方法进行分词处理,获得词汇集合;从所述词汇集合中确定高频词汇作为机器学习特征;对每一历史电子文件内容使用信息检索加权算法,计算该历史电子文件内容在各机器学习特征上的信息检索加权数值;根据各历史电子文件的接收方信息确定电子文件类型;根据各机器学习特征、各电子文件类型和各信息检索加权数值形成学习矩阵;根据所述学习矩阵,采用机器学习算法进行拟合训练,生成派发模型;获得待处理电子文件,并经过所述派发模型进行派发处理。
技术领域
本发明涉及电子文件处理技术领域,尤其涉及一种电子文件的智能派发方法及装置。
背景技术
随着互联网和计算机技术的不断发展,当前各行各业大多已经开始采用电子办公,即各种单据已经开始采用电子文件的形式,例如电子邮件、银行等行业的客服单、物流等行业的提货单等等。
现有的各行各业中,企业人员众多,分支机构和职位也较为繁多,在进行电子办公时,大多需要将各种电子文件进行频繁的分派和转发。例如企业总裁的一个电子邮件可能会下发给各分支机构的总经理,再由各分支机构的总经理下发到各部门负责人,再由各部门负责人下发给各员工等。同样,各种客服单、提货单等电子文件也可能存在被层层转发和分派的问题。目前,电子文件的派发大多是由人工负责处理,这降低了派发的及时性和准确性,使得电子文件不能又快有准地到达目的地。
发明内容
本发明的实施例提供一种电子文件的智能派发方法及装置,以实现各类电子文件的智能派发,无需人工干涉,提高电子文件派发的准确性和及时性。
为达到上述目的,本发明采用如下技术方案:
一种电子文件的智能派发方法,包括:
获得各历史电子文件内容作为机器学习样本;
对每一历史电子文件内容通过自然语言处理分词方法进行分词处理,获得词汇集合;
从所述词汇集合中确定高频词汇作为机器学习特征;
对每一历史电子文件内容使用信息检索加权算法,计算该历史电子文件内容在各机器学习特征上的信息检索加权数值;
根据各历史电子文件的接收方信息确定电子文件类型;
根据各机器学习特征、各电子文件类型和各信息检索加权数值形成学习矩阵;
根据所述学习矩阵,采用机器学习算法进行拟合训练,生成派发模型;
获得待处理电子文件,并经过所述派发模型进行派发处理。
具体的,所述获得各历史电子文件内容作为机器学习样本,包括:
从预先设置的电子文件系统中获得各历史电子文件内容;
将各历史文件内容导入到预设格式的数据库中,以作为机器学习样本;所述预设格式的数据库中包含数据表,所述数据表包括电子文件内容对应的数据项和数据类型。
具体的,所述对每一历史电子文件内容通过自然语言处理分词方法进行分词处理,获得词汇集合,包括:
获取预先设置的电子文件所属领域的专有词典和停用词典;
根据所述专有词典和停用词典,采用自然语言处理分词方法对每一历史电子文件内容进行分词处理,获得词汇集合。
具体的,所述从所述词汇集合中确定高频词汇作为机器学习特征,包括:
从所述词汇集合中获得全部历史电子文件内容进行分词后的全部词汇和各词汇出现次数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810901835.2/2.html,转载请声明来源钻瓜专利网。