[发明专利]确定文本中要素属性冲突的方法、装置、设备和介质在审
申请号: | 202011487640.1 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112560434A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 纪登林;徐伟建;罗雨;彭卫华;郑宇宏;李陶 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N3/08 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 文本 要素 属性 冲突 方法 装置 设备 介质 | ||
1.一种利用神经网络模型确定文本中要素属性冲突的方法,包括:
获取相关的第一文本和第二文本,所述第一文本和所述第二文本均包括目标要素和针对所述目标要素的同一属性的相关描述;
提取所述第二文本所包括的一个或多个子文本;
将所述第一文本和所述一个或多个子文本中的至少一部分子文本输入神经网络模型,获取所述神经网络模型输出的所述第一文本和所述至少一部分子文本中的每一个相应的预测结果,所述预测结果能够表征所述第一文本和相应的子文本之间是否存在针对所述目标要素的属性冲突;以及
基于所述至少一部分子文本相应的至少一个预测结果,确定所述第一文本和所述第二文本之间是否存在要素属性冲突。
2.如权利要求1所述的方法,其中,所述预测结果包括属性一致、属性不一致、属性无关。
3.如权利要求2所述的方法,其中,确定所述第一文本和所述第二文本之间是否存在要素属性冲突:
响应于确定所述至少一部分子文本中的至少其中一个子文本相应的预测结果为属性不一致,确定所述第一文本和所述第二文本之间存在要素属性冲突。
4.如权利要求2所述的方法,其中,确定所述第一文本和所述第二文本之间是否存在要素属性冲突:
响应于确定所述至少一部分子文本中的每一个子文本相应的预测结果均为属性一致,确定所述第一文本和所述第二文本之间不存在要素属性冲突。
5.如权利要求2所述的方法,其中,确定所述第一文本和所述第二文本之间是否存在要素属性冲突:
针对所述至少一部分子文本,响应于确定中的至少其中一个子文本相应的预测结果为属性一致,剩余的子文本相应的预测结果为属性无关,确定所述第一文本和所述第二文本之间不存在要素属性冲突。
6.如权利要求1所述的方法,其中,以句子为单位将所述第二文本切割为所述一个或多个子文本。
7.如权利要求1-6中任一项所述的方法,其中,所述第一文本和所述第二文本均为医疗病例文本,
其中,所述第一文本为主诉,所述第二文本为与所述主诉对应的现病史,
其中,所述医疗病例文本所包括的要素包括以下中的任意一个:
疾病、症状、检查项目、检查结果、手术和药物,
其中,所述要素的属性包括以下中的任意一个:
部位、时间、严重程度和等级。
8.一种用于确定文本中要素属性冲突的神经网络模型的训练方法,包括:
获取均包括目标要素的第一样本文本和第二样本文本,并标注所述第一样本文本和所述第二样本文本之间的与所述目标要素相关的真实属性冲突类别,
将所述第一样本文本和第二样本文本输入神经网络模型,获取所述神经网络模型输出的预测属性冲突类别;
基于真实属性冲突类别和预测属性冲突类别,计算损失值;以及
基于所述损失值调整所述神经网络模型的参数。
9.如权利要求8所述的训练方法,其中,所述真实属性冲突类别包括属性一致、属性不一致、属性无关。
10.如权利要求9所述的训练方法,还包括:
基于知识图谱,构建属性一致的第一样本文本组,每一组样本文本包括所述第一样本文本和第二样本文本;
基于所述第一样本文本组,构建属性不一致的第二样本文本组;以及
基于所述第一样本文本组,构建属性无关的第三样本文本组。
11.如权利要求10所述的训练方法,其中,通过修改所述第二样本文本的属性内容来构建属性不一致的第二样本文本组,所述第二样本文本的修改后的属性内容和所述第一样本文本的属性内容的属性类别相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011487640.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可穿戴设备主板测试治具
- 下一篇:一种节能环保的计算机用显卡散热装置