[发明专利]模板文件的生成方法、装置、计算机可读介质及电子设备在审
申请号: | 201810367499.8 | 申请日: | 2018-04-23 |
公开(公告)号: | CN110309315A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 周辉阳 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/27 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 模板文件 预设 目标实体 计算机可读介质 标签替换 电子设备 模板文件生成 多个模板 实体标签 标签 检测 | ||
本发明的实施例提供了一种模板文件的生成方法、装置、计算机可读介质及电子设备。该生成方法包括:检测语料数据中包含的预设实体名称;根据实体名称与实体标签之间的对应关系,确定与预设实体名称相对应的目标实体标签;通过该目标实体标签替换语料数据中包含的预设实体名称,以生成语料数据的模板文件;其中,若语料数据中存在字符重叠的多个预设实体名称,则分别通过该多个预设实体名称所对应的目标实体标签替换语料数据中相应的实体名称,以生成语料数据的多个模板文件。本发明实施例的技术方案可以避免在出现字符重叠的实体名称时,仅针对其中的一个实体名称生成相应的模板文件而导致模板文件生成不全面、且可能会生成不准确的模板文件的问题。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种模板文件的生成方法、装置、计算机可读介质及电子设备。
背景技术
在自然语言的处理过程中,好的模板对于一个领域的语料而言十分重要,其泛化性和可用性都能够得到保证,但是如何从海量的用户询问数据中抽取出合适的模板文件是一个难题,目前并没有有效的解决方案。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例提供一种模板文件的生成方法、装置、计算机可读介质及电子设备,进而至少在一定程度上解决现有技术中无法得到全面的模板文件的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的一个方面,提供了一种模板文件的生成方法,包括:检测语料数据中包含的预设实体名称;根据实体名称与实体标签之间的对应关系,确定与所述预设实体名称相对应的目标实体标签;通过所述目标实体标签替换所述语料数据中包含的所述预设实体名称,以生成所述语料数据的模板文件;其中,若所述语料数据中存在字符重叠的多个预设实体名称,则分别通过所述多个预设实体名称所对应的目标实体标签替换所述语料数据中相应的实体名称,以生成所述语料数据的多个模板文件。
根据本发明实施例的一个方面,提供了一种模板文件的生成装置,包括:第一检测单元,用于检测语料数据中包含的预设实体名称;确定单元,用于根据实体名称与实体标签之间的对应关系,确定与所述预设实体名称相对应的目标实体标签;生成单元,用于通过所述目标实体标签替换所述语料数据中包含的所述预设实体名称,以生成所述语料数据的模板文件;其中,所述生成单元还用于在所述语料数据中存在字符重叠的多个预设实体名称时,分别通过所述多个预设实体名称所对应的目标实体标签替换所述语料数据中相应的实体名称,以生成所述语料数据的多个模板文件。
根据本发明实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的模板文件的生成方法。
根据本发明实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的模板文件的生成方法。
在本发明的一些实施例所提供的技术方案中,通过根据实体名称与实体标签之间的对应关系,确定与语料数据中包含的预设实体名称相对应的目标实体标签,并通过目标实体标签替换语料数据中包含的预设实体名称,使得能够通过自动匹配的方式来生成语料数据的模板文件。而在语料数据中存在字符重叠的多个预设实体名称时,分别通过该多个预设实体名称对应的目标实体标签替换语料数据中相应的实体名称,使得可以针对不同的预设实体名称都能够生成相应的模板文件,避免在出现字符重叠的预设实体名称时,仅针对其中的一个预设实体名称生成相应的模板文件而导致模板文件生成不全面、且可能会生成不准确的模板文件的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810367499.8/2.html,转载请声明来源钻瓜专利网。