[发明专利]一种以实体为导向的生物医学关系抽取方法、装置及存储介质在审
| 申请号: | 202310457288.4 | 申请日: | 2023-04-25 |
| 公开(公告)号: | CN116595171A | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | 扈应;陈艳平;黄瑞章;秦永彬 | 申请(专利权)人: | 贵州大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/30;G06N5/025;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G16B40/00;G16H50/70 |
| 代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 张彪 |
| 地址: | 550025 贵州省贵*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实体 导向 生物医学 关系 抽取 方法 装置 存储 介质 | ||
1.一种以实体为导向的生物医学关系抽取方法,其特征在于:所述方法包括以下步骤:
步骤一:提取关系实例的全局语义信息,提取关系实例的面向实体的语义信息;
步骤二:通过全局语义信息和以实体为导向的语义信息计算实体对中各实体对应的差异向量;
步骤三:结合关系实例的全局语义信息和实体对中各实体对应的差异向量完成关系分类。
2.根据权利要求1所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述提取关系实例的全局语义信息的方法为:通过在关系实例的句子中插入特殊标记符标识实体,然后传入预训练语言模型中进行语义编码,最后使用预训练语言模型的CLS向量作为全局语义信息。
3.根据权利要求1所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述提取关系实例的面向实体的语义信息的方法为:通过对关系实例中不同的实体进行实体标识、MASK和线索插入操作,然后输入到预训练语言模型中,使用卷积、池化操作进一步提取实体特征用于表示面向实体的语义信息。
4.根据权利要求1所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述差异向量的计算方法为:
其中,Og为全局语义信息,是以实体e1为导向的语义信息,是以实体e2为导向的语义信息,是向量拼接操作,-是向量相减操作,是实体e1对应的差异向量,是实体e2对应的差异向量。
5.根据权利要求4所述的以实体为导向的生物医学关系抽取方法,其特征在于:所述结合关系实例的全局语义信息和实体对中各实体对应的差异向量完成关系分类的方法为:
S01、将全局语义信息和实体对中各实体对应的差异向量进行拼接,
S02、使用MLP网络对关系类型进行分类:
y`=Softmax(MLP(MLP(Ee)+MLP(Og)));
其中,Ee表示拼接特征,y`表示分类结果。
6.一种以实体为导向的生物医学关系抽取装置,其特征在于:所述装置包括:处理器和存储器,其中,所述存储器中存储有适于所述处理器执行的计算机程序指令,所述计算机程序指令被所述处理器运行时使得所述处理器执行如权利要求1-5任一项所述的以实体为导向的生物医学关系抽取方法。
7.一种存储介质,包括存储在所述存储介质上的计算机程序指令,其中,所述计算机程序指令被处理器运行时执行如权利要求1-5任一项所述的以实体为导向的生物医学关系抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310457288.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扩展问筛选方法、装置、电子设备及存储介质
- 下一篇:一种电感器的制备方法





