[发明专利]标点符号处理方法和标点符号处理装置在审
申请号: | 202110447240.6 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113515953A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 汤丽 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/35 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标点符号 处理 方法 装置 | ||
本申请公开了一种标点符号处理方法和标点符号处理装置,属于数据处理技术领域。该标点符号处理方法包括:在第一语句包括标点符号的情况下,对标点符号进行遮蔽处理,生成至少一个第二语句;确定第二语句与第一语句的语义差异值;根据语义差异值,确定标点符号的情感属性。
技术领域
本申请属于数据处理技术领域,具体涉及一种标点符号处理方法和标点符号处理装置。
背景技术
目前,用户的表达越来越灵活和自由,标点符号很多时候不再仅仅是作为标点使用。图1中展示了一段对话中标点符号的一些表述,有些标点符号为正常的标点符号用法,而有些标点符号则有着特殊含义,或者包含了用户强烈的情感。
然而,相关技术中,采用算法对用户数据进行理解时,大多数情况都会将不规范的标点符号事先清洗掉,只保留规范的标点符号,这会导致用户信息的丢失;或者没有对标点符号的表达进行处理及理解,将这种灵活的标点符号的表达按照标准的标点符号去看待,会导致对用户数据的理解偏差,无法准确获取用户的表达内容。
发明内容
本申请实施例的目的是提供一种标点符号处理方法和标点符号处理装置,能够解决相关技术中无法正确识别标点符号的含义的问题。
第一方面,本申请实施例提供了一种标点符号处理方法,该方法包括:
在第一语句包括标点符号的情况下,对标点符号进行遮蔽处理,生成至少一个第二语句;
确定第二语句与第一语句的语义差异值;
根据语义差异值,确定标点符号的情感属性。
第二方面,本申请实施例提供了一种标点符号处理装置,该装置包括:
处理模块,用于在第一语句包括标点符号的情况下,对标点符号进行遮蔽处理,生成至少一个第二语句;
第一确定模块,用于确定第二语句与第一语句的语义差异值;
第二确定模块,用于根据语义差异值,确定标点符号的情感属性。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的方法。
在本申请实施例中,识别原语句(即第一语句)中是否包括标点符号,如果包含标点符号,则将需要识别的标点符号进行遮蔽处理,计算遮蔽前的原语句和遮蔽后的语句(即第二语句)在语义和情感分类上的差距,根据该差距确定标点符号的情感属性。具体地,标点符号的情感属性包括标点符号为有语义符号和标点符号为无语义符号,若语义上和情感上差距过大,则可以判断该标点符号在原语句中有着特殊的含义或情感,即为有语义符号;若语义上和情感上差距不大,则可以判断该标点符号在原语句中没有特殊的含义或情感,即为无语义符号。本申请实施例中,能够准确地识别出用户表述中的标点符号是否具有特殊语义或情感,从而保证后续对标点符号的处理的合理性,避免由于识别错误而误将有意义的标号符号进行清洗,确保对用户语句表达的正确性。
附图说明
图1是相关技术中用户对话的示意图;
图2是本申请实施例的标点符号处理方法的流程示意图之一;
图3是本申请实施例的对第一语句进行情感分类的示意图;
图4是本申请实施例的标点符号处理方法的流程示意图之二;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110447240.6/2.html,转载请声明来源钻瓜专利网。