[发明专利]确定文本中要素属性冲突的方法、装置、设备和介质在审
申请号: | 202011487640.1 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112560434A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 纪登林;徐伟建;罗雨;彭卫华;郑宇宏;李陶 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N3/08 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 文本 要素 属性 冲突 方法 装置 设备 介质 | ||
本公开提供了一种确定文本中要素属性冲突的方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及深度学习、知识图谱、自然语言处理技术领域。实现方案为:获取相关的第一文本和第二文本,第一文本和第二文本均包括目标要素和针对目标要素的同一属性的相关描述;提取第二文本所包括的一个或多个子文本;将第一文本和一个或多个子文本中的至少一部分子文本输入神经网络模型,获取神经网络模型输出的第一文本和至少一部分子文本中的每一个相应的预测结果,预测结果能够表征第一文本和相应的子文本之间是否存在针对目标要素的属性冲突;以及基于至少一部分子文本相应的至少一个预测结果,确定第一文本和第二文本之间是否存在要素属性冲突。
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习、知识图谱、自然语言处理技术领域,具体涉及一种确定文本中要素属性冲突的方法、装置、设备和介质。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
在自然语言处理领域中,多段文本中针对同一要素存在不一致的要素属性是一个常见的不规范类型。例如在医疗病历文本中,要素可以是疾病,该要素的属性可以包括疾病的发病部位,则多段文本中针对同一要素存在不一致的要素属性例如可以是在病例的主诉与现病史中,对某疾病的发病部位的记录不一致。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种确定文本中要素属性冲突的方法、装置、设备和介质。
根据本公开的一方面,提供了一种由计算机实现的利用神经网络模型确定文本中要素属性冲突的方法,包括:获取相关的第一文本和第二文本,所述第一文本和所述第二文本均包括目标要素和针对所述目标要素的同一属性的相关描述;提取所述第二文本所包括的一个或多个子文本;将所述第一文本和所述一个或多个子文本中的至少一部分子文本输入神经网络模型,获取所述神经网络模型输出的所述第一文本和所述至少一部分子文本中的每一个相应的预测结果,所述预测结果能够表征所述第一文本和相应的子文本之间是否存在针对所述目标要素的属性冲突;以及基于所述至少一部分子文本相应的至少一个预测结果,确定所述第一文本和第二文本之间是否存在要素属性冲突。
根据本公开的另一方面,提供了一种由计算机实现的用于确定文本中要素属性冲突的神经网络模型的训练方法,包括:获取均包括目标要素的第一样本文本和第二样本文本,并标注所述第一样本文本和所述第二样本文本之间的与所述目标要素相关的真实属性冲突类别,将所述第一样本文本和第二样本文本输入神经网络模型,获取所述神经网络模型输出的预测属性冲突类别;基于真实属性冲突类别和预测属性冲突类别,计算损失值;以及基于所述损失值调整所述神经网络模型的参数。
根据本公开的另一方面,提供了一种文本要素属性冲突确定装置,包括:获取单元,被配置用于获取相关的第一文本和第二文本,所述第一文本和所述第二文本均包括目标要素和针对所述目标要素的同一属性的相关描述;提取单元,被配置用于提取所述第二文本所包括的一个或多个子文本;神经网络,被配置用于基于所述第一文本和所述一个或多个子文本中的至少一部分子文本,输出所述第一文本和所述至少一部分子文本中的每一个相应的预测结果,所述预测结果能够表征所述第一文本和相应的子文本之间是否存在针对所述目标要素的属性冲突;以及确定单元,被配置用于基于所述至少一部分子文本相应的至少一个预测结果,确定所述第一文本和第二文本之间是否存在要素属性冲突。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011487640.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可穿戴设备主板测试治具
- 下一篇:一种节能环保的计算机用显卡散热装置