[发明专利]一种以实体为导向的生物医学关系抽取方法、装置及存储介质在审

专利信息
申请号: 202310457288.4 申请日: 2023-04-25
公开(公告)号: CN116595171A 公开(公告)日: 2023-08-15
发明(设计)人: 扈应;陈艳平;黄瑞章;秦永彬 申请(专利权)人: 贵州大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36;G06F40/30;G06N5/025;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G16B40/00;G16H50/70
代理公司: 贵阳中新专利商标事务所 52100 代理人: 张彪
地址: 550025 贵州省贵*** 国省代码: 贵州;52
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实体 导向 生物医学 关系 抽取 方法 装置 存储 介质
【权利要求书】:

1.一种以实体为导向的生物医学关系抽取方法,其特征在于:所述方法包括以下步骤:

步骤一:提取关系实例的全局语义信息,提取关系实例的面向实体的语义信息;

步骤二:通过全局语义信息和以实体为导向的语义信息计算实体对中各实体对应的差异向量;

步骤三:结合关系实例的全局语义信息和实体对中各实体对应的差异向量完成关系分类。

2.根据权利要求1所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述提取关系实例的全局语义信息的方法为:通过在关系实例的句子中插入特殊标记符标识实体,然后传入预训练语言模型中进行语义编码,最后使用预训练语言模型的CLS向量作为全局语义信息。

3.根据权利要求1所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述提取关系实例的面向实体的语义信息的方法为:通过对关系实例中不同的实体进行实体标识、MASK和线索插入操作,然后输入到预训练语言模型中,使用卷积、池化操作进一步提取实体特征用于表示面向实体的语义信息。

4.根据权利要求1所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述差异向量的计算方法为:

其中,Og为全局语义信息,是以实体e1为导向的语义信息,是以实体e2为导向的语义信息,是向量拼接操作,-是向量相减操作,是实体e1对应的差异向量,是实体e2对应的差异向量。

5.根据权利要求4所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述结合关系实例的全局语义信息和实体对中各实体对应的差异向量完成关系分类的方法为:

S01、将全局语义信息和实体对中各实体对应的差异向量进行拼接,

S02、使用MLP网络对关系类型进行分类:

y`=Softmax(MLP(MLP(Ee)+MLP(Og)));

其中,Ee表示拼接特征,y`表示分类结果。

6.一种以实体为导向的生物医学关系抽取装置,其特征在于:所述装置包括:处理器和存储器,其中,所述存储器中存储有适于所述处理器执行的计算机程序指令,所述计算机程序指令被所述处理器运行时使得所述处理器执行如权利要求1-5任一项所述的以实体为导向的生物医学关系抽取方法。

7.一种存储介质,包括存储在所述存储介质上的计算机程序指令,其中,所述计算机程序指令被处理器运行时执行如权利要求1-5任一项所述的以实体为导向的生物医学关系抽取方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310457288.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top