[发明专利]文件评价方法、装置、设备及存储介质在审
申请号: | 202310342686.1 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116362222A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王耀;张晓永;黄莹;潘芸倩;奚悦;叶静娴;陈又新 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F18/22;G06Q10/063;G06Q40/03;G06F16/35;G06F18/24;G06F40/289 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 评价 方法 装置 设备 存储 介质 | ||
1.一种文件评价方法,其特征在于,包括:
从待评价文件中提取结构化文本和非结构化文本;
从所述结构化文本中提取第一预设特征计算文本;
基于所述第一预设特征计算文本,采用多维度评价方法计算得到所述第一预设特征;
从所述非结构化文本中提取第二预设特征计算文本;
计算所述第二预设特征计算文本与预设的基准文本的相似度,将所述相似度作为所述第二预设特征;
根据所述第一预设特征、所述第二预设特征计算得到所述待评价文件的评价分值。
2.根据权利要求1所述的文件评价方法,其特征在于,在所述根据所述第一预设特征、所述第二预设特征计算得到所述待评价文件的评价分值的步骤后,还包括:
判断所述待评价文件的评价分值是否大于预设的阈值;
若大于,则将所述待评价文件划分到符合要求的类别;
若不大于,则将所述待评价文件划分到不符合要求的类别。
3.根据权利要求1所述的文件评价方法,其特征在于,所述计算所述第二预设特征计算文本与预设的基准文本的相似度,包括:
将所述第二预设特征计算文本进行分词,得到第一分词文本;
将所述基准文本进行分词,得到第二分词文本;
将所述第一分词文本换为向量,得到第一向量;
将所述第二分词文本转换为向量,得到第二向量;
根据所述第一向量和所述第二向量计算所述第二预设特征计算文本与所述预设的基准文本的相似度。
4.根据权利要求3所述的文件评价方法,其特征在于,所述根据所述第一向量和所述第二向量计算所述第二预设特征计算文本与所述预设的基准文本的相似度,包括:
根据公式计算所述第二预设特征计算文本与预设的基准文本的相似度;其中,xβ表示相似度,v1表示第一向量,v2表示第二向量。
5.根据权利要求1所述的文件评价方法,其特征在于,所述基于所述第一预设特征计算文本,采用多维度评价方法计算得到所述第一预设特征,包括:
从所述第一预设特征计算文本中提取要素文本;
利用所述要素文本对应的多个评价体系对所述要素文本进行评价,得到多个评价结果;
根据所述多个评价体系以及所述多个评价结果计算所述要素文本的得分;
根据所述要素文本的得分计算所述第一预设特征。
6.根据权利要求5所述的文件评价方法,其特征在于,所述根据所述要素文本的得分计算所述第一预设特征,包括:
根据公式
且ω,μ∈[0,1],
计算所述第一预设特征;其中,xα表示第一预设特征,n1表示要素文本的总数,ωi表示第i个要素文本的权重,m表示第i个要素文本的得分,i∈[1,n1];n2表示要素文本对应的评价体系的总数,pj表示第j个评价结果,μj表示第j个评价体系对应的权重,j∈[1,n2]。
7.根据权利要求1所述的文件评价方法,其特征在于,所述根据所述第一预设特征、所述第二预设特征计算得到所述待评价文件的评价分值,包括:
获取所述第一预设特征对应的权重、所述第二预设特征对应的权重以及预设的常量;
根据所述第一预设特征、所述第一预设特征对应的权重、所述第二预设特征、所述第二预设特征对应的权重以及预设的常量计算得到第一数值;
将所述第一数值输入sigmoid函数,得到所述待评价文件的评价分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310342686.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像生成方法及系统
- 下一篇:一种驻车时长计量方法、计算设备及存储介质