[发明专利]实体标注模型的训练方法、实体标注方法以及装置有效
申请号: | 201811314682.8 | 申请日: | 2018-11-06 |
公开(公告)号: | CN111143571B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 李宽;杨春勇;权圣 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 标注 模型 训练 方法 以及 装置 | ||
本申请公开了一种实体标注模型的训练方法、实体标注方法以及装置,训练方法包括:将已标注语料以及目标领域的未标注语料输入到深度序列模型;通过深度序列模型根据已标注语料的实体类型对目标领域的未标注语料进行实体类型的标注,得到目标领域的未标注语料的标注实体类型;通过深度序列模型对目标领域的未标注语料进行实体类型预测,得到目标领域的未标注语料的预测实体类型;将标注实体类型与预测实体类型进行比对,根据比对结果确定对深度序列模型是否进行再训练,并得到实体标注模型,实体标注模型为训练完成的深度序列模型。通过上述方式,能够在不需要大量人工标注语料的前提下,实现不同领域的无监督实体标注。
技术领域
本申请涉及人工智能模型应用技术领域,特别是涉及一种实体标注模型的训练方法、实体标注方法以及装置。
背景技术
命名实体识别是自然语言处理中的一项基本任务,可以识别出文本中的人名、地名等实体。随着现在人工智能的高速发展,以命名实体识别为基础的知识抽取、自动回答等应用对命名识别性能也提出了更高的要求。
传统的命名实体识别主要基于有监督的学习,需要专家或标注人员对实体类型进行定义以及对大量的语料进行标注,费时费力,无法满足现有的命名实体识别在不同领域的需求。
发明内容
本申请主要解决的技术问题是提供一种实体标注模型的训练方法、实体标注方法及装置,能够在不需要大量人工标注语料的前提下,实现不同领域的无监督实体标注。
为解决上述技术问题,本申请采用的第一个技术方案是:提供一种实体标注模型的训练方法,包括:将已标注语料以及目标领域的未标注语料输入到深度序列模型;通过深度序列模型根据已标注语料的实体类型对目标领域的未标注语料进行实体类型的标注,得到目标领域的未标注语料的标注实体类型;通过深度序列模型对目标领域的未标注语料进行实体类型预测,得到目标领域的未标注语料的预测实体类型;将标注实体类型与预测实体类型进行比对,根据比对结果确定对深度序列模型是否进行再训练,并得到实体标注模型,所述实体标注模型为训练完成的所述深度序列模型。
为解决上述技术问题,本申请采用的第二个技术方案是:提供一种实体标注方法,实体标注方法基于实体标注模型,实体标注模型是通过已标注语料以及目标领域的未标注语料对深度序列模型进行迭代优化得到的,包括:接收到待标注的语料;通过实体标注模型对待标注的语料进行实体抽取,并对实体的类型进行标注;输出待标注的语料的预测实体类型标注。
为解决上述技术问题,本申请采用的第三个技术方案是:提供一种实体标注模型的训练装置,包括语料输入模块、实体类型标注模块、答案预测模块以及模型优化模块,语料输入模块用于将已标注语料以及目标领域的未标注语料输入到深度序列模型;实体类型标注模块用于通过深度序列模型根据已标注语料的实体类型对目标领域的未标注语料进行实体类型的标注,得到目标领域的未标注语料的标注实体类型;答案预测模块用于通过深度序列模型对目标领域的未标注语料进行实体类型预测,得到目标领域的未标注语料的预测实体类型;
模型优化模块用于将标注实体类型与预测实体类型进行比对,根据比对结果确定对深度序列模型是否进行再训练,并得到实体标注模型,所述实体标注模型为训练完成的所述深度序列模型。
为解决上述技术问题,本申请采用的第四个技术方案是:提供一种智能装置,智能装置包括实体标注模型,实体标注模型是通过已标注语料以及目标领域的未标注语料对深度序列模型进行迭代优化得到的,包括:语料接收模块、实体类型标注模块以及输出模块;语料接收模块用于接收到待标注的语料;实体类型标注模块用于通过实体标注模型对待标注的语料进行实体抽取,并对实体的类型进行标注;输出模块用于输出待标注的语料的预测实体类型标注。
为解决上述技术问题,本申请采用的第五个技术方案是:提供一种智能终端,智能终端包括相互耦接的人机交互控制电路以及处理器及可在处理器上运行的计算机程序,处理器执行计算机程序时上述任一项实体标注模型的训练方法或执行上述任一项的实体标注方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811314682.8/2.html,转载请声明来源钻瓜专利网。