[发明专利]文本打标方法及装置在审
申请号: | 202310099070.6 | 申请日: | 2023-01-12 |
公开(公告)号: | CN116089614A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 袁堃平;兰金鹤;夏回美;唐志慧;张晋 | 申请(专利权)人: | 杭州瓴羊智能服务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F40/30 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 张瑞 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 方法 装置 | ||
本说明书实施例提供文本打标方法及装置,其中所述方法包括:接收待处理文本,将待处理文本分别输入至规则匹配模型、分类匹配模型和语义匹配模型;获得规则匹配模型输出对应规则维度的规则标签、分类匹配模型输出对应分类维度的分类标签,以及语义匹配模型输出对应语义维度的语义标签;确定规则标签、分类标签和语义标签分别对应的标签属性信息;基于标签属性信息对规则标签、分类标签和语义标签进行过滤处理,根据过滤处理结果确定待处理文本对应的目标标签。从多维度对待处理文本进行识别,识别出规则维度的规则标签、分类维度的分类标签、语义维度的语义标签,对不同维度下的标签进行过滤处理,进一步提升识别准确率,获得更准确的识别结果。
技术领域
本说明书实施例涉及自然语言处理技术领域,特别涉及文本打标方法、策略调整方法。本说明书一个或者多个实施例同时涉及文本打标装置、策略调整装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着互联网技术的快速发展,人类进入大数据时代,每天都会产生海量的数据,因此对海量数据进行分析、获取有价值的信息已成为人们共同关系的热点。在新闻领域中,可以对新闻资讯文本进行标签设定,后期按照标签进行对新闻资讯文本进行审核、投放;在服务领域中也可以对客户评价进行标签设定,后期可以根据标签了解客户意图、分析产品的售卖情况。
在现有技术中,对文本进行分类打标大多为行业相关人员基于行业经验手动进行打标,在数据量大的情况下,打标效率低下且需要高度依赖于知识和经验。或通过预训练模型对文本进行打标,但是由于不同情况下相同意思的文本表达方式不同,从而模型预测的标签准确率较低,存在相同语义的文本所对应的标签不一致的情况。因此,如何准确的识别出文本对应的标签是目前亟需解决的问题。
发明内容
有鉴于此,本说明书实施例提供了文本打标方法、策略调整方法。本说明书一个或者多个实施例同时涉及文本打标装置、策略调整装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种文本打标方法,包括:
接收待处理文本,将所述待处理文本分别输入至规则匹配模型、分类匹配模型和语义匹配模型;
获得所述规则匹配模型输出对应规则维度的规则标签、所述分类匹配模型输出对应分类维度的分类标签,以及所述语义匹配模型输出对应语义维度的语义标签;
确定所述规则标签、所述分类标签和所述语义标签分别对应的标签属性信息;
基于所述标签属性信息对所述规则标签、所述分类标签和所述语义标签进行过滤处理,根据过滤处理结果确定所述待处理文本对应的目标标签。
根据本说明书实施例的第二方面,提供了一种策略调整方法,包括:
确定目标对象、所述目标对象对应的目标运营策略和所述目标对象对应的目标待处理文本;
对所述目标待处理文本进行文本打标方法的文本打标处理,获得所述目标待处理文本对应的问题标签;
基于所述问题标签确定所述目标对象的目标问题,并基于所述目标问题调整所述目标运营策略。
根据本说明书实施例的第三方面,提供了一种文本打标方法,包括:
确定目标对象的用户评价文本,并将所述用户评价文本分别输入至规则匹配模型、分类匹配模型和语义匹配模型;
获得所述规则匹配模型输出对应规则维度的规则标签、所述分类匹配模型输出对应分类维度的分类标签,以及所述语义匹配模型输出对应语义维度的语义标签;
确定所述规则标签、所述分类标签和所述语义标签分别对应的标签属性信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州瓴羊智能服务有限公司,未经杭州瓴羊智能服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310099070.6/2.html,转载请声明来源钻瓜专利网。