[发明专利]一种基于迁移学习的中医健康咨询文本命名实体识别方法有效
| 申请号: | 201910076463.9 | 申请日: | 2019-01-26 |
| 公开(公告)号: | CN109918644B | 公开(公告)日: | 2022-12-16 |
| 发明(设计)人: | 文贵华;陈河宏 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于迁移学习的中医健康咨询文本命名实体识别方法,包括以下步骤:S1、选择其他领域文本命名实体识别标注数据集,构造神经网络,进行预训练。S2、分别构造单向循环神经网络,利用中医健康咨询文本无标注数据集,进行语言模型训练,得到前向和反向语言模型。S3、融合单向语言模型的循环网络层输出特征,结合全连接网络层和条件随机场层得到最终的命名实体识别模型。S4、使用中医健康咨询文本命名实体识别标注数据集,进行微调训练。所述方法能够迁移其它领域的命名实体识别有标注文本知识和本领域的无标注文本知识,有效提高中医健康咨询文本命名实体识别的准确率和召回率,加速模型的收敛速度。 | ||
| 搜索关键词: | 一种 基于 迁移 学习 中医 健康 咨询 文本 命名 实体 识别 方法 | ||
【主权项】:
1.一种基于迁移学习的中医健康咨询文本命名实体识别方法,其特征在于,所述方法包括以下步骤:S1、构造函数,根据与中医健康咨询命名实体识别任务的相关性,选择其他领域文本命名实体识别标注数据集,构造神经网络,利用其他领域文本命名实体识别标注数据集对神经网络进行预训练;S2、分别构造前向和反向的循环神经网络,利用中医健康咨询文本无标注数据集,分别对前向和反向的循环神经网络进行预训练,得到前向语言模型和反向语言模型;S3、在S1预训练的神经网络基础上,融合S2中前向语言模型和反向语言模型的循环神经网络层特征,结合全连接网络层和条件随机场层,得到中医健康咨询文本命名实体识别模型;S4、在S3的文本命名实体识别模型的基础上,使用中医健康咨询文本命名实体识别标注数据集,执行逐层学习率衰减的微调训练,训练完成后得到最终的中医健康咨询文本命名实体识别模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910076463.9/,转载请声明来源钻瓜专利网。





