[发明专利]文本的实体关系抽取方法和模型训练方法有效
申请号: | 202010082707.7 | 申请日: | 2020-02-07 |
公开(公告)号: | CN111339774B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 陈曦;卢睿轩;文瑞;孙继超;刘羽 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/36 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种文本的实体关系抽取方法和模型训练方法,本申请可以应用于人工智能领域的自然语言处理技术中,本申请的通过图状态循环神经网络和BERT模型的结合,从文本中分别抽取用于表征文本的语义特征的第一向量和用于表征文本的依存关系特征的第二向量,并将第一向量和第二向量拼接后进行分类,使得实体对的关系抽取在长句和跨句的应用场景中获得较好的准确度,改善了现有技术中在长句和跨句等应用场景下准确度不足的问题,此外,本申请在模型训练阶段,基于预设规则和预训练模型,通过远程监督的方式大量生产标注数据,可以在较低的成本下获得大量较为准确的训练数据。可见,本申请可以广泛应用于自然语言处理技术中。 | ||
搜索关键词: | 文本 实体 关系 抽取 方法 模型 训练 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010082707.7/,转载请声明来源钻瓜专利网。