[发明专利]一种基于医疗的神经网络和向量相似度匹配方法和装置在审
申请号: | 202211674458.6 | 申请日: | 2022-12-26 |
公开(公告)号: | CN116341545A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 欧锦华;李晓鹏 | 申请(专利权)人: | 广州启生信息技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/194;G06F16/35;G16H50/70 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 医疗 神经网络 向量 相似 匹配 方法 装置 | ||
1.一种基于医疗的神经网络和向量相似度匹配方法,其特征在于,包括:
采用分类模型建立训练模型,并建立医学神经网络模型库;
根据人工录入医学实体词,完成向量计算操作,获取向量集合库;
根据向量集合库完成相似度计算,并由余弦相似性计算公式获取相似度结果;
根据相似度结果集获取实体结果集。
2.根据权利要求1所述的基于医疗的神经网络和向量相似度匹配方法,其特征在于,所述分类模型为二分类模型。
3.根据权利要求2所述的基于医疗的神经网络和向量相似度匹配方法,其特征在于,所述二分类模型由BERT模型库函数tokenizer训练样本数据。
4.根据权利要求1所述的基于医疗的神经网络和向量相似度匹配方法,其特征在于,所述向量计算为BERT直接输出的向量维度,向量维度为[Ne,字数,768],由集合公式计算获得。
5.根据权利要求4所述的基于医疗的神经网络和向量相似度匹配方法,其特征在于,所述集合公式为,Ve=[bert(ei)],其中i=0到Ne-1,Ve向量集合库。
6.根据权利要求1所述的基于医疗的神经网络和向量相似度匹配方法,其特征在于,所述余弦相似性计算公式为,其中a和b是两个不同的实体向量,
a=(x1,x2,x3,…,xi),xi为实体向量a的第i维向量,
b=(y1,y2,y3,…,yi),yi为实体向量b的第i维向量。
7.根据权利要求1所述的基于医疗的神经网络和向量相似度匹配方法,其特征在于,所述相似度结果由cos相似度算法计算用户词与实体词的向量间的相似度并提取排行前n个实体词,其中n为50。
8.一种基于医疗的神经网络和向量相似度匹配装置,其特征在于,包括:
神经网络模型训练模块,用于根据医学样本词库训练神经网络模型;
用户词汇分词模块,用于根据用户输入,完成分词操作;
向量计算模块,用于根据所有医学实体词完成向量计算操作,向量计算操作完成后作为神经网络参数完成神经网络模型训练;
相似度计算模块,用于把用户输入的用户词与召回池中的医学实体词建立神经网络模型。
9.根据权利要求8所述的基于医疗的神经网络和向量相似度匹配装置,其特征在于,所述相似度计算,计算结果为1的保留,为0的去除。
10.根据权利要求9所述的基于医疗的神经网络和向量相似度匹配装置,其特征在于,所述相似度由执行代码获得,其中所述执行代码为final_entity=filter_zero(classifier(u,recalli)),其中i=0到Nr-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州启生信息技术有限公司,未经广州启生信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211674458.6/1.html,转载请声明来源钻瓜专利网。