[发明专利]一种文本提取方法、装置、设备及介质在审

专利信息
申请号: 202010773751.2 申请日: 2020-08-04
公开(公告)号: CN112069311A 公开(公告)日: 2020-12-11
发明(设计)人: 游程;陈孝良;苏少炜;常乐 申请(专利权)人: 北京声智科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/279;G06F40/205
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 江宁
地址: 100080 北京市海淀区北四*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 提取 方法 装置 设备 介质
【说明书】:

发明关于一种文本提取方法、装置、设备及介质,用以确定在文本中关于属性的评价文本,有助于提升确定属性的评价态度准确率,节约训练成本。所述方法包括:获取目标场景的目标文本,所述目标场景对应预设数量个场景属性;利用预先训练的位置确定模型确定场景属性对应的属性评价文本在所述目标文本中的位置,所述位置确定模型是基于用于识别两个文本之间的文本关联关系的关系确定模型训练生成的;根据所述场景属性对应的属性评价文本在所述目标文本中的位置,提取场景属性对应的属性评论文本。

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种文本提取方法、装置、设备及介质。

背景技术

目前,评论分析时自然语言处理领域的热门问题。评论分析的目的是从用户评论文本中抽取多个属性的态度评价。通常用户的评论文本是较长文本(由多个语句构成的评论文本),并且会包含多个属性的评价文本,通过属性的评价文本可以确定用户对该属性的评价态度。现有技术通过分类模型确定出的一个属性评价态度的分类,会对确定其他属性评价态度的分类产生影响。例如,一个关于酒店评论文本“这个酒店装修不错位置一般我找了半天才找到,早餐还是挺好吃的,但是价格贼贵”。其中,“不错”是一个积极评价态度,若分类模型确定属性“位置”的评价态度为积极评价态度,则影响了属性“装修”的评价态度。

若在分类模型进行对属性的评价态度分类之前,利用序列标注模型先确定文本中包含哪些属性的评价态度,然后将确定的属性输入到该属性对应的分类模型中确定文本关于该属性的态度评价,这将需要大量的被标注出每种属性的文本作为训练序列标注模型,也意味着需要大量的标注成本,另外还需要针对每种属性分别训练各属性对应的分类模型,增加了训练成本和训练时间。

因此,亟需一种能够确定属性在文本中对应的属性评价文本的解决方案,以提高确定属性评价态度的准确率。

发明内容

本发明提供一种文本提取方法、装置、设备及介质,用以确定在文本中关于属性的评价文本,有助于提升确定属性的评价态度准确率,节约训练成本。

第一方面,本发明实施例提供一种文本提取方法,方法包括:

获取目标场景的目标文本,目标场景对应预设数量个场景属性;

利用预先训练的位置确定模型确定场景属性对应的属性评价文本在目标文本中的位置,位置确定模型是基于用于识别两个文本之间的文本关联关系的关系确定模型训练生成的;

根据场景属性对应的属性评价文本在目标文本中的位置,提取场景属性对应的属性评论文本。

本发明实施例提供的文本提取方法,通过预先训练的位置确定模型,可以确定场景属性与目标文本之间的文本关联关系,还可以确定场景属性对应的属性评价文本在目标文本中的位置,并提取出场景属性对应的属性评价文本,基于场景属性与目标文本之间的文本关系,确定场景属性对应的属性评价文本在目标文本中的位置,有助于提升确定场景属性对应属性评价文本在目标文本中位置的准确率。由于确定出场景属性对应的属性评价文本,在根据场景属性对应的属性评价文本确定场景属性的属性评价态度时的准确率高于现有技术中根据目标文本确定场景属性的属性评价态度时的准确率。并且,无需训练多个不同场景属性的位置确定模型,节约了训练成本,缩短确定场景属性对应属性评价文本的处理过程。通过一个位置确定模型可以确定目标场景中多个场景属性的属性评价态度,位置确定模型具有更精细的处理能力,提升位置确定模型处理效率。

一种可能的实施方式中,本发明实施例提供的文本提取方法中,位置确定模型,采用如下步骤训练:

以目标场景的第一文本样本、设置的第一文本样本的场景属性标记、设置的场景属性对应的属性评论文本在第一文本样本中的位置,作为关系确定模型的输入,以场景属性对应的属性评论文本在第一文本样本中的位置作为关系确定模型的输出,对关系确定模型进行训练,将训练后的关系确定模型作为位置确定模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010773751.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top