[发明专利]模型训练方法、分析方法、装置、设备及介质在审
申请号: | 202210005005.8 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114357170A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 陈芳 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 樊晓 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 分析 装置 设备 介质 | ||
本公开提供了一种基于用户评论的模型训练方法,可以应用于人工智能技术领域。该基于用户评论的模型训练方法,包括:按照不同的倾向性情绪类型对第一目标数量的用户评论文本进行分类处理,得到含有分类标签的训练文本集,其中,训练文本集中包括多条具有分类标签的用户评论文本;将训练文本集中的用户评论文本输入至预训练的语言表征模型,以便输出每条用户评论文本的特征向量;将每条用户评论文本的特征向量输入逻辑回归模型,以便输出每条用户评论文本的分类结果;以及根据每条用户评论文本的分类结果和分类标签调整预训练的语言表征模型的模型参数。本公开还提供了一种基于用户评论的模型分析方法、装置、设备、存储介质和程序产品。
技术领域
本公开涉及人工智能领域,具体涉及一种基于用户评论的模型训练方法、分析方法、装置、设备、介质和程序产品。
背景技术
随着科学技术的发展,网络成为了人们交流心得、表达看法的重要平台。当经济社会中出现大众关注的评论焦点时,往往包含着倾向性的言论观点,产生较强影响力的社会评论,对经济的发展也会带来一定的影响。
互联网数据信息呈指数式增长,错综杂乱的评论信息不能较好的让用户迅速抓住关键点,并较为准确地分析评论信息。
因此,如何在错综杂乱的评论信息里,较为快速准确地掌握用户评论的倾向性方向尤为重要。
发明内容
鉴于上述问题,本公开提供了基于用户评论的模型训练方法、分析方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种基于用户评论的模型训练方法,包括:
按照不同的倾向性情绪类型对第一目标数量的用户评论文本进行分类处理,得到含有分类标签的训练文本集,其中,训练文本集中包括多条具有分类标签的用户评论文本;
将训练文本集中的用户评论文本输入至预训练的语言表征模型,以便输出每条用户评论文本的特征向量;
将每条用户评论文本的特征向量输入逻辑回归模型,以便输出每条用户评论文本的分类结果;以及
根据每条用户评论文本的分类结果和分类标签调整预训练的语言表征模型的模型参数。
根据本公开的实施例,语言表征模型包括预训练模型和微调模型,将训练文本集中的用户评论文本输入至预训练的语言表征模型,以便输出每条用户评论文本的特征向量包括:
根据预训练模型的模型参数,初始化微调模型的模型参数,得到已调参的初始微调模型;
将训练文本集中的用户评论文本输入至已调参的初始微调模型,通过数字化编码提取单词特征、单词属性特征、单词位置特征;
将单词特征、单词属性特征和单词位置特征进行融合,输出融合后的特征向量;
将融合后的特征向量输入语言表征模型的隐藏层,输出每条用户评论文本的特征向量。
根据本公开的实施例,在按照不同的倾向性情绪类型对第一目标数量的用户评论文本进行分类处理,得到含有分类标签的训练文本集之前,还包括:
对获取的预设数量的用户评论文本,进行预处理,得到目标数量的用户评论文本;
从目标数量的用户评论文本中进行筛选,得到第一目标数量的用户评论文本。
根据本公开的实施例,对获取的预设数量的用户评论文本,进行预处理,得到目标数量的用户评论文本包括:
将预设数量的用户评论文本中的表情符号转换为文本,得到目标数量的用户评论文本;和/或
将预设数量的用户评论文本中的无效数据进行剔除,得到目标数量的用户评论文本。
根据本公开的实施例,基于用户评论的模型训练方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210005005.8/2.html,转载请声明来源钻瓜专利网。