[发明专利]文本处理方法和装置、以及电子设备和可读存储介质有效
申请号: | 201910639511.0 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110347800B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 李嘉淳;张培 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06K9/62;G06F40/205 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 以及 电子设备 可读 存储 介质 | ||
本公开提供了一种文本处理方法,包括:获取待处理文本;确定待处理文本中包括的属于多个预定类型词库中每个预定类型词库的词汇量;以及根据词汇量,利用预测模型得到待处理文本的预测价值度。本公开还提供了一种文本处理装置、一种电子设备和一种计算机可读存储介质。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种文本处理方法和装置、以及一种电子设备和计算机可读存储介质。
背景技术
随着互联网的快速发展,通过线上渠道获取客户问题留言,并对此留言进行深入分析已经成为提升产品满意度和客户体验的重要方式。
在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题:对于客户问题留言内容的快速、精准分析尚无法离开人工处理。但人工处理成本较高,效率难以得到有效提升。其中,导致上述问题的原因主要包括:客户问题留言的数量增长迅速,从而导致人工分析的工作量大幅增加。客户问题留言通常具有较强的主观性,获取的问题留言中包含了相当一部分价值较低的信息,这部分价值较低的信息严重影响了分析效率。客户留言时所使用的语言不规范,进一步阻碍了分析效率。
发明内容
有鉴于此,本公开提供了一种能够分析问题价值度,从而提高分析效率的文本处理方法和装置,以及一种电子设备和计算机可读存储介质。
本公开的一个方面提供了一种文本处理方法,该方法包括:获取待处理文本;确定待处理文本的文本长度,以及待处理文本包括的属于多个预定类型词库中每个预定类型词库的词汇量;以及根据文本长度及词汇量,利用预测模型得到待处理文本的预测价值度。
可选地,上述文本处理方法还包括获取预测模型,其中,获取预测模型包括循环执行以下第一循环操作,直至多个第二已处理文本的相关值大于等于预定相关值:获取与多个第一已处理文本一一对应的多个第一样本数据;根据多个第一样本数据及原始预测模型,调整原始预测模型以得到待优化预测模型;以及利用待优化预测模型处理与多个第二已处理文本对应的多个第二样本数据,得到针对多个第二已处理文本中每个第二已处理文本的预测价值度。其中,在针对多个第二已处理文本的相关值大于等于预定相关值的情况下,确定待优化预测模型为预测模型;其中,每个第二已处理文本的相关值包括每个第二已处理文本的预测价值度与每个第二已处理文本的实际价值度的相关值。
可选地,上述调整原始预测模型以得到待优化预测模型包括:利用原始预测模型得到每个第一已处理文本的第一初始预测价值度;以及以原始预测模型作为初始预测模型,循环执行以下第二循环操作,直至第一初始预测价值度与第二初始预测价值度的差值小于等于预定差值:采用预定策略调整初始预测模型,得到调整后初始预测模型;利用调整后初始预测模型得到每个第一已处理文本的第二初始预测价值度;以及在第一初始预测价值度与第二初始预测价值度的差值大于预定差值的情况下,更改预定策略,并以调整后初始预测模型作为初始预测模型,以第二初始预测价值度作为第一初始预测价值度,返回重新调整初始预测模型。其中,在第一初始预测价值度与第二初始预测价值度的差值小于等于预定差值的情况下,确定初始预测模型为待优化预测模型。
可选地,在获取多个第一样本数据之前,第一循环操作还包括:根据预定抽样比,从已处理文本库中获取多个第一已处理文本。在得到针对多个第二已处理文本中每个第二已处理文本的预测价值度之前,第一循环操作还包括:从已处理文本库中获取多个第二已处理文本,以及获取多个第二已处理文本中每个第二已处理文本的实际价值度。第一循环操作还包括:调整预定抽样比;和/或增加多个预定类型词库中至少一个预定类型词库的词汇量。
可选地,上述获取每个第二已处理文本的实际价值度包括:获取每个第二已处理文本的内容详细度和功能定位准确度;以及根据内容详细度和功能定位准确度,确定每个第二已处理文本的实际价值度。
可选地,上述相关值包括Pearson相关值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910639511.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语言模型训练方法、装置和计算机设备
- 下一篇:一种商品分类编码匹配方法及系统