[发明专利]基于妊娠期的营养饮食管理图谱创建方法及装置有效
申请号: | 202210293527.2 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114758749B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 聂再清;张嘉欢;黄婷婷;马为之;刘洋;马维英;黄文灏;曹岗;赵小帆;史业民;张学丰 | 申请(专利权)人: | 清华大学;北京智源人工智能研究院 |
主分类号: | G16H20/60 | 分类号: | G16H20/60;G16H50/70;G06F18/25;G06F16/36;G06F16/35;G06F16/31;G06F40/279;G06F16/242;G06F16/901 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 任少瑞 |
地址: | 100084 北京市海淀区双清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 妊娠期 营养 饮食 管理 图谱 创建 方法 装置 | ||
1.一种基于妊娠期的营养饮食管理图谱创建方法,其特征在于,包括:
获取与妊娠糖尿病相关的目标结构化数据和目标非结构化数据;
基于所述目标结构化数据,确定所述妊娠糖尿病的症状及与所述症状具有关联关系的营养饮食信息,并基于所述症状和所述营养饮食信息,创建妊娠期的营养饮食管理图谱本体;
识别所述目标非结构化数据中与所述症状和/或所述营养饮食信息匹配的目标实体关系;
基于所述营养饮食管理图谱本体,确定所述目标非结构化数据中待标注的实体标签和待抽取的实体关系标签;其中,所述实体标签用于表征所述症状和所述营养饮食信息的实体;
对所述目标非结构化数据进行分词,得到分词结果;
将所述分词结果与所述实体标签进行匹配;
当所述分词结果与所述实体标签匹配成功时,标注所述分词结果中的第一实体;
基于所述实体关系标签,对所述第一实体进行关系抽取,得到所述目标非结构化数据中与所述症状和/或所述营养饮食信息匹配的目标实体关系;
在所述将所述分词结果与所述实体标签进行匹配的步骤之后,所述方法还包括:
当所述分词结果中的第二分词描述与所述实体标签匹配失败时,计算所述第二分词描述与所述营养饮食管理图谱本体内实体的第一余弦相似度;
根据所述第一余弦相似度,从所述第二分词描述中确定待对齐实体、中心分词描述和相邻分词描述;
计算所述待对齐实体分别与所述中心分词描述和所述相邻分词描述的第二余弦相似度,并基于所述第二余弦相似度,确定所述第二分词描述中的第二实体;
基于所述实体关系标签,对所述第二分词描述中的所述第二实体进行关系抽取,得到所述目标非结构化数据中与所述症状和/或所述营养饮食信息匹配的目标实体关系;
所述根据所述第一余弦相似度,从所述第二分词描述中确定待对齐实体、中心分词描述和相邻分词描述,包括:
选取所述第一余弦相似度中的第一最高余弦相似度,并在所述第二分词描述中确定所述第一最高余弦相似度对应的待对齐实体和中心分词描述,然后在所述第二分词描述中所述中心分词描述的前后选取相邻分词描述;
所述基于所述第二余弦相似度,确定所述第二分词描述中的第二实体,包括:
选取所述第二余弦相似度中的第二最高余弦相似度,并在所述第二分词描述中确定所述第二最高余弦相似度对应的第二实体;
所述计算所述第二分词描述与所述营养饮食管理图谱本体内实体的第一余弦相似度,包括:
其中,xm表示m个所述第二分词描述的编码表示,yn表示所述营养饮食管理图谱本体内n个实体的编码表示,cosθ1表示m*n个所述第一余弦相似度,m和n均为正整数;
将所述营养饮食管理图谱本体和所述目标实体关系进行融合处理,生成妊娠糖尿病营养饮食管理图谱。
2.根据权利要求1所述的基于妊娠期的营养饮食管理图谱创建方法,其特征在于,所述获取与妊娠糖尿病相关的目标结构化数据和目标非结构化数据,包括:
采集针对妊娠糖尿病的第一结构化数据、半结构化数据以及非结构化数据;
根据预设的各类型的实体包含的关键词和关系关键词,对所述半结构化数据中的实体关系进行抽取,得到第二结构化数据;
对所述第一结构化数据、所述第二结构化数据和所述非结构化数据进行校验,生成与妊娠糖尿病相关的目标结构化数据和目标非结构化数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京智源人工智能研究院,未经清华大学;北京智源人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210293527.2/1.html,转载请声明来源钻瓜专利网。