[发明专利]文本打标方法及装置在审
申请号: | 202310099070.6 | 申请日: | 2023-01-12 |
公开(公告)号: | CN116089614A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 袁堃平;兰金鹤;夏回美;唐志慧;张晋 | 申请(专利权)人: | 杭州瓴羊智能服务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F40/30 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 张瑞 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 方法 装置 | ||
1.一种文本打标方法,包括:
接收待处理文本,将所述待处理文本分别输入至规则匹配模型、分类匹配模型和语义匹配模型;
获得所述规则匹配模型输出对应规则维度的规则标签、所述分类匹配模型输出对应分类维度的分类标签,以及所述语义匹配模型输出对应语义维度的语义标签;
确定所述规则标签、所述分类标签和所述语义标签分别对应的标签属性信息;
基于所述标签属性信息对所述规则标签、所述分类标签和所述语义标签进行过滤处理,根据过滤处理结果确定所述待处理文本对应的目标标签。
2.如权利要求1所述的方法,获得所述规则匹配模型输出对应规则维度的规则标签,包括:
通过所述规则匹配模型基于初始标签对应的标签匹配信息,将所述待处理文本与所述初始标签进行匹配;
根据匹配结果确定对应规则维度的规则标签并输出。
3.如权利要求1所述的方法,获得所述分类匹配模型输出对应分类维度的分类标签,包括:
通过所述分类匹配模型对所述待处理文本进行编码,获得所述待处理文本对应的编码向量;
基于所述编码向量和向量标签映射关系确定对应分类维度的分类标签并输出。
4.如权利要求1所述的方法,获得所述语义匹配模型输出对应语义维度的语义标签,包括:
通过所述语义匹配模型分析获得所述待处理文本的语义信息;
基于所述语义信息和初始标签对应的基准语义信息进行匹配,根据匹配结果确定对应语义维度的语义标签。
5.如权利要求1所述的方法,基于所述标签属性信息对所述规则标签、所述分类标签和所述语义标签进行过滤处理,根据过滤处理结果确定所述待处理文本对应的目标标签,包括:
根据所述标签属性信息确定所述规则标签、所述分类标签、所述语义标签分别对应的标签置信度;
确定标签置信度阈值,并基于所述标签置信度阈值与所述规则标签、所述分类标签、所述语义标签分别对应的标签置信度进行比较;
根据比较结果确定所述待处理文本对应的目标标签。
6.如权利要求1所述的方法,基于所述标签属性信息对所述规则标签、所述分类标签和所述语义标签进行过滤处理,根据过滤处理结果确定所述待处理文本对应的目标标签,包括:
根据所述标签属性信息确定所述规则标签、所述分类标签、所述语义标签分别对应的标签句式信息;
确定所述待处理文本对应的目标句式信息,并基于所述目标句式信息与所述规则标签、所述分类标签、所述语义标签分别对应的标签句式信息进行判断;
根据判断结果确定所述待处理文本对应的目标标签。
7.如权利要求1所述的方法,基于所述标签属性信息对所述规则标签、所述分类标签和所述语义标签进行过滤处理,根据过滤处理结果确定所述待处理文本对应的目标标签,包括:
根据所述标签属性信息确定所述规则标签、所述分类标签和所述语义标签分别对应的标签类别信息
根据所述规则标签、所述分类标签和所述语义标签分别对应的标签类别信息确定互斥标签和共享标签;
确定互斥标签的互斥标签置信度,并基于互斥标签置信度在所述互斥标签中选择目标互斥标签;
将所述目标互斥标签和所述共享标签作为所述待处理文本对应的目标标签。
8.如权利要求1所述的方法,根据所述标签属性信息中的标签优先级信息对所述规则标签、所述分类标签和所述语义标签进行优先级过滤处理,根据过滤处理结果确定所述待处理文本对应的目标标签,包括:
根据所述标签属性信息所述规则标签、所述分类标签和所述语义标签分别对应的标签优先级信息;
根据所述规则标签、所述分类标签和所述语义标签分别对应的标签优先级信息进行排序;
根据排序结果确定所述待处理文本对应的目标标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州瓴羊智能服务有限公司,未经杭州瓴羊智能服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310099070.6/1.html,转载请声明来源钻瓜专利网。