[发明专利]文件评价方法、装置、设备及存储介质在审
申请号: | 202310342686.1 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116362222A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王耀;张晓永;黄莹;潘芸倩;奚悦;叶静娴;陈又新 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F18/22;G06Q10/063;G06Q40/03;G06F16/35;G06F18/24;G06F40/289 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 评价 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能技术领域,提供一种文件评价方法、装置、设备及存储介质,其具体可应用于金融领域和医疗领域的文件评价,方法包括:从待评价文件中提取结构化文本和非结构化文本;从结构化文本中提取第一预设特征计算文本;基于第一预设特征计算文本,采用多维度评价方法计算得到第一预设特征;从非结构化文本中提取第二预设特征计算文本;计算第二预设特征计算文本与预设的基准文本的相似度,将相似度作为第二预设特征;根据第一预设特征、第二预设特征计算得到待评价文件的评价分值。本发明实施例提高了文件评价结果的准确性。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种文件评价方法、装置、设备及存储介质。
背景技术
对文件的甄别评价是企业和公司运营中的重要工作环节,涉及包括且不限于简历遴选、银行企业注册信息归类等多种业务类型。而对于相关文件的收集、管理和处理工作往往有着重复性高、流程固定、周期性强的特点,因此随着计算机技术的进步和发展,人工智能相关技术手段也开始赋能文件归类、筛选、归类的多种业务场景,在保证准确度的前提下,降低人力成本并提升相关工作效率和效果。
但发明人发现,目前智能文件评价方法没有区分结构化和非结构化文本进行处理,且由于评价方法单一,导致根据文件评分筛选得到的文件也不能完全符合要求或分类不满足规范。以银行审查贷款资质场景为例:银行评估公司的风险指标时会采用以公司绝对市值等方式筛选公司财务体量不符合要求的公司,但受行业、产品生命周期、是否为上市企业(有对应公开数据)等因素影响,部分具有极高发展潜力的公司在发展过程中难以短期内实现高市值,因而无法获得贷款和足够的发展机会。同时,仅凭借市值的筛选标准,也可能忽略部分公司的舆情风险等信息,存在投资后暴雷的可能性,给银行放贷带来风险。
发明内容
针对上述技术问题,本申请的目的在于提供一种文件评价方法、装置、设备及存储介质,旨在解决目前文件评价方法没有区分结构化和非结构化文本进行处理,且由于评价方法单一,导致评价结果不够准确的技术问题。
第一方面,本发明实施例提供一种文件评价方法,包括:
从待评价文件中提取结构化文本和非结构化文本;
从所述结构化文本中提取第一预设特征计算文本;
基于所述第一预设特征计算文本,采用多维度评价方法计算得到所述第一预设特征;
从所述非结构化文本中提取第二预设特征计算文本;
计算所述第二预设特征计算文本与预设的基准文本的相似度,将所述相似度作为所述第二预设特征;
根据所述第一预设特征、所述第二预设特征计算得到所述待评价文件的评价分值。
进一步的,在所述根据所述第一预设特征、所述第二预设特征计算得到所述待评价文件的评价分值的步骤后,还包括:
判断所述待评价文件的评价分值是否大于预设的阈值;
若大于,则将所述待评价文件划分到符合要求的类别;
若不大于,则将所述待评价文件划分到不符合要求的类别。
进一步的,所述计算所述第二预设特征计算文本与预设的基准文本的相似度,包括:
将所述第二预设特征计算文本进行分词,得到第一分词文本;
将所述基准文本进行分词,得到第二分词文本;
将所述第一分词文本换为向量,得到第一向量;
将所述第二分词文本转换为向量,得到第二向量;
根据所述第一向量和所述第二向量计算所述第二预设特征计算文本与所述预设的基准文本的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310342686.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像生成方法及系统
- 下一篇:一种驻车时长计量方法、计算设备及存储介质