[发明专利]一种医疗症状实体信息归一化方法和系统在审

专利信息
申请号: 202210736314.2 申请日: 2022-06-27
公开(公告)号: CN115148367A 公开(公告)日: 2022-10-04
发明(设计)人: 黄友福;肖龙源;李海洲;李稀敏;李威 申请(专利权)人: 厦门快商通科技股份有限公司
主分类号: G16H50/70 分类号: G16H50/70;G06F40/295;G06F40/211;G06N3/04;G06N3/08
代理公司: 厦门市首创君合专利事务所有限公司 35204 代理人: 连耀忠
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 医疗 症状 实体 信息 归一化 方法 系统
【权利要求书】:

1.一种医疗症状实体信息归一化方法,其特征在于,包括:

根据疾病信息定义标准症状类别列表,所述疾病信息包括但不限于疾病特征、疾病种类以及疾病生理现象;

对原始数据集中的每条疾病数据,利用实体识别方法识别所包含的原始症状,结合实体识别方法抽取出的原始症状和疾病数据本身文本,对疾病数据进行打标,其标签类别为标准症状列表中的一类,标注完后作为模型训练数据集;

针对训练数据集中的每条句子信息进行embedding编码,得到维度为[40,80]的句子矩阵X1,针对训练数据集中的每条症状信息进行embedding编码,得到维度为[40,80]的实体矩阵X2,针对训练数据集中的每条标准症状类别进行embedding编码,得到维度为[N,1]的向量Y,其中N为定义的标准症状类别数,向量的每个维度代表一个类别,本标准症状类别对应的维度值为1,另外维度值为0;

利用训练数据中的句子矩阵X1和实体矩阵X2进行实体信息归一化模型的训练,得到训练完成后的实体信息归一化模型;

利用实体识别方法对疾病句子进行识别,提取出实体识别方法识别到的症状实体信息;将句子信息和症状实体信息进行embedding编码,将编码后的句子矩阵和实体矩阵输入训练完成后的实体信息归一化模型,得到维度为[1,N]的向量,确定实体信息归一化模型输出的N维向量中值最大的元素所在的维度,得到归一化后的对应类别。

2.根据权利要求1所述的一种医疗症状实体信息归一化方法,其特征在于,所述实体识别方法包括但不限于:HMM模型,CRF模型以及RNN模型方法。

3.根据权利要求1所述的一种医疗症状实体信息归一化方法,其特征在于,所述实体信息归一化模型包括:句子编码模块,实体症状编码模块,句子批量标准化模块,实体症状标准化模块,句子自注意力模块,第一拼接模块,第一自注意力模块,第二拼接模块以及全连接层。

4.根据权利要求1所述的一种医疗症状实体信息归一化方法,其特征在于,所述利用训练数据中的句子矩阵X1和实体矩阵X2进行实体信息归一化模型的训练,得到训练完成后的实体信息归一化模型,具体包括:

输入句子矩阵X1,按0.5比例进行随机抽取,输入句子批量标准化模块得到句子标准化矩阵X1a,维度为[40,80],将句子标准化矩阵X1a输入句子自注意力模块,得到句子向量X1b,维度为[1,80];

输入实体矩阵X2,按0.5比例进行随机抽取,输入实体批量标准化模块得到实体标准化矩阵X2a,维度为[8,80];

将句子标准化矩阵X1a和实体标准化X2a输入第一拼接模块进行拼接,得到标准化拼接矩阵X3,维度为[48,80];

将标准化拼接矩阵X3输入第一自注意力模块得到标准化注意向量X4,维度为[1,80];

将句子向量X1b和标准化注意向量X4输入第二拼接模块进行拼接,得到组合向量X5,维度为[1,160];

将组合向量X5输入全连接层并用softmax进行归一化,得到输出向量Y’,维度为[1,N];组合向量X5输入全连接层后得到预设维度为[1,N]的向量,将预设维度为[1,N]的向量的每个元素经过softmax进行归一化就得到向量Y’;向量Y’的维度为[1,N],所有元素值的和为1;softmax公式为其中z为向量Y’的元素,i取值为1,2,3...N;

计算输出向量Y’与Y的交叉熵,逐步迭代优化至满足迭代条件,得到训练完成后的实体信息归一化模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210736314.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top