[发明专利]一种医学文本的预测方法、预测装置及电子设备在审

专利信息
申请号: 202110110184.7 申请日: 2021-01-27
公开(公告)号: CN113449515A 公开(公告)日: 2021-09-28
发明(设计)人: 王兴维;邰从越;刘慧芳;刘龙 申请(专利权)人: 心医国际数字医疗系统(大连)有限公司
主分类号: G06F40/237 分类号: G06F40/237;G06F40/284;G06F40/30;G06F40/232;G06N3/04;G06N3/08;G16H15/00;G16H40/60
代理公司: 北京金信知识产权代理有限公司 11225 代理人: 范继晨
地址: 116023 辽宁省大连市高新技*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 医学 文本 预测 方法 装置 电子设备
【权利要求书】:

1.一种医学文本的预测方法,其特征在于,包括以下步骤:

获取前缀文本,所述前缀文本包括N个字符;

将所述前缀文本输入至预先训练好的语言模型;

输出与所述前缀文本对应的M个候选文本;其中,每个所述候选文本均能够与所述前缀文本组合形成医学文本。

2.根据权利要求1的预测方法,其特征在于,所述语言模型通过以下方式训练:

针对训练样本进行切分,获得词序列,所述词序列由所述训练样本中每个字单元的编号按照预定顺序组成;

在所述词序列中提取词向量;

获取不同的所述词向量之间的关联度;

基于所述关联度获取测试样本;

基于所述测试样本和验证样本确定所述语言模型的模型参数。

3.根据权利要求2的预测方法,其特征在于,在所述针对训练样本进行切分之前,还包括:

获取第一样本集,其中,所述第一样本集为历史医学文本;

对所述第一样本集进行预处理,得到第二样本集;

将所述第二样本集作为所述训练样本。

4.根据权利要求3的预测方法,其特征在于,所述对所述第一样本集进行预处理,得到第二样本集,包括:

针对所述第一样本集中的每个文本进行清洗;

对清洗后的所述第一样本集的所有文本进行泛化处理;

将进行泛化处理之后的所述第一样本集的所有文本中的标点符号进行标准化,得到所述第二样本集。

5.根据权利要求3的预测方法,其特征在于,所述历史医学文本至少包括病历描述文本、影像学描述文本、医生诊断文本中的至少一种。

6.根据权利要求2的预测方法,其特征在于,每个所述字单元为字符、词组以及分词中的一个。

7.根据权利要求1的预测方法,其特征在于,所述输出与所述前缀文本对应的M个候选文本,包括:

判断所述前缀文本是否存在于预设词库中;

在所述前缀文本存在于所述预设词库的情况下并且当N大于1的情况下,确定L个中间文本,其中,L大于等于M;

直到在满足预定条件下,从所述中间文本中确定M个所述候选文本。

8.根据权利要求7的预测方法,其特征在于,所述在所述前缀文本存在于所述预设词库的情况下并且当N大于1的情况下,确定L个中间文本,包括:

基于前缀文本中所述第1至所述第N-1个字符之间每相邻两个字符之间的第一关联度以及第1至第N-1个字符和第N个字符之间的第二关联度,确定Q个候选字符;

确定每个所述候选字符的概率值;

将高于概率阈值的L个所述候选字符与所述前缀文本组成中间文本。

9.根据权利要求7的预测方法,其特征在于,所述预设词库中至少包括医学术语、医生的惯用词汇。

10.根据权利要求1的预测方法,其特征在于,所述获取前缀文本,包括:

实时接收所述医生对应的终端设备发送的前缀文本;所述前缀文本为所述医生基于所述终端设备的输入装置输入的。

11.根据权利要求10的预测方法,其特征在于,所述输出与所述前缀文本对应的M个候选文本,包括:

将M个所述候选文本发送给所述终端设备;

控制所述终端设备显示M个所述候选文本。

12.一种医学文本的预测装置,其特征在于,包括:

获取模块,用于获取前缀文本,所述前缀文本包括N个字符;

输入模块,用于将所述前缀文本输入至预先训练好的语言模型;

输出模块,用于输出与所述前缀文本对应的M个候选文本;其中,每个所述候选文本均能够与所述前缀文本组合形成医学文本。

13.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至11任意一项所述的医学文本的预测方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于心医国际数字医疗系统(大连)有限公司,未经心医国际数字医疗系统(大连)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110110184.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top