[发明专利]一种医疗症状实体信息归一化方法和系统在审
申请号: | 202210736314.2 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115148367A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 黄友福;肖龙源;李海洲;李稀敏;李威 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F40/295;G06F40/211;G06N3/04;G06N3/08 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 连耀忠 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 症状 实体 信息 归一化 方法 系统 | ||
1.一种医疗症状实体信息归一化方法,其特征在于,包括:
根据疾病信息定义标准症状类别列表,所述疾病信息包括但不限于疾病特征、疾病种类以及疾病生理现象;
对原始数据集中的每条疾病数据,利用实体识别方法识别所包含的原始症状,结合实体识别方法抽取出的原始症状和疾病数据本身文本,对疾病数据进行打标,其标签类别为标准症状列表中的一类,标注完后作为模型训练数据集;
针对训练数据集中的每条句子信息进行embedding编码,得到维度为[40,80]的句子矩阵X1,针对训练数据集中的每条症状信息进行embedding编码,得到维度为[40,80]的实体矩阵X2,针对训练数据集中的每条标准症状类别进行embedding编码,得到维度为[N,1]的向量Y,其中N为定义的标准症状类别数,向量的每个维度代表一个类别,本标准症状类别对应的维度值为1,另外维度值为0;
利用训练数据中的句子矩阵X1和实体矩阵X2进行实体信息归一化模型的训练,得到训练完成后的实体信息归一化模型;
利用实体识别方法对疾病句子进行识别,提取出实体识别方法识别到的症状实体信息;将句子信息和症状实体信息进行embedding编码,将编码后的句子矩阵和实体矩阵输入训练完成后的实体信息归一化模型,得到维度为[1,N]的向量,确定实体信息归一化模型输出的N维向量中值最大的元素所在的维度,得到归一化后的对应类别。
2.根据权利要求1所述的一种医疗症状实体信息归一化方法,其特征在于,所述实体识别方法包括但不限于:HMM模型,CRF模型以及RNN模型方法。
3.根据权利要求1所述的一种医疗症状实体信息归一化方法,其特征在于,所述实体信息归一化模型包括:句子编码模块,实体症状编码模块,句子批量标准化模块,实体症状标准化模块,句子自注意力模块,第一拼接模块,第一自注意力模块,第二拼接模块以及全连接层。
4.根据权利要求1所述的一种医疗症状实体信息归一化方法,其特征在于,所述利用训练数据中的句子矩阵X1和实体矩阵X2进行实体信息归一化模型的训练,得到训练完成后的实体信息归一化模型,具体包括:
输入句子矩阵X1,按0.5比例进行随机抽取,输入句子批量标准化模块得到句子标准化矩阵X1a,维度为[40,80],将句子标准化矩阵X1a输入句子自注意力模块,得到句子向量X1b,维度为[1,80];
输入实体矩阵X2,按0.5比例进行随机抽取,输入实体批量标准化模块得到实体标准化矩阵X2a,维度为[8,80];
将句子标准化矩阵X1a和实体标准化X2a输入第一拼接模块进行拼接,得到标准化拼接矩阵X3,维度为[48,80];
将标准化拼接矩阵X3输入第一自注意力模块得到标准化注意向量X4,维度为[1,80];
将句子向量X1b和标准化注意向量X4输入第二拼接模块进行拼接,得到组合向量X5,维度为[1,160];
将组合向量X5输入全连接层并用softmax进行归一化,得到输出向量Y’,维度为[1,N];组合向量X5输入全连接层后得到预设维度为[1,N]的向量,将预设维度为[1,N]的向量的每个元素经过softmax进行归一化就得到向量Y’;向量Y’的维度为[1,N],所有元素值的和为1;softmax公式为其中z为向量Y’的元素,i取值为1,2,3...N;
计算输出向量Y’与Y的交叉熵,逐步迭代优化至满足迭代条件,得到训练完成后的实体信息归一化模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210736314.2/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置