[发明专利]一种文本提取方法、装置、设备及介质在审
申请号: | 202010773751.2 | 申请日: | 2020-08-04 |
公开(公告)号: | CN112069311A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 游程;陈孝良;苏少炜;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279;G06F40/205 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 江宁 |
地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 提取 方法 装置 设备 介质 | ||
本发明关于一种文本提取方法、装置、设备及介质,用以确定在文本中关于属性的评价文本,有助于提升确定属性的评价态度准确率,节约训练成本。所述方法包括:获取目标场景的目标文本,所述目标场景对应预设数量个场景属性;利用预先训练的位置确定模型确定场景属性对应的属性评价文本在所述目标文本中的位置,所述位置确定模型是基于用于识别两个文本之间的文本关联关系的关系确定模型训练生成的;根据所述场景属性对应的属性评价文本在所述目标文本中的位置,提取场景属性对应的属性评论文本。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种文本提取方法、装置、设备及介质。
背景技术
目前,评论分析时自然语言处理领域的热门问题。评论分析的目的是从用户评论文本中抽取多个属性的态度评价。通常用户的评论文本是较长文本(由多个语句构成的评论文本),并且会包含多个属性的评价文本,通过属性的评价文本可以确定用户对该属性的评价态度。现有技术通过分类模型确定出的一个属性评价态度的分类,会对确定其他属性评价态度的分类产生影响。例如,一个关于酒店评论文本“这个酒店装修不错位置一般我找了半天才找到,早餐还是挺好吃的,但是价格贼贵”。其中,“不错”是一个积极评价态度,若分类模型确定属性“位置”的评价态度为积极评价态度,则影响了属性“装修”的评价态度。
若在分类模型进行对属性的评价态度分类之前,利用序列标注模型先确定文本中包含哪些属性的评价态度,然后将确定的属性输入到该属性对应的分类模型中确定文本关于该属性的态度评价,这将需要大量的被标注出每种属性的文本作为训练序列标注模型,也意味着需要大量的标注成本,另外还需要针对每种属性分别训练各属性对应的分类模型,增加了训练成本和训练时间。
因此,亟需一种能够确定属性在文本中对应的属性评价文本的解决方案,以提高确定属性评价态度的准确率。
发明内容
本发明提供一种文本提取方法、装置、设备及介质,用以确定在文本中关于属性的评价文本,有助于提升确定属性的评价态度准确率,节约训练成本。
第一方面,本发明实施例提供一种文本提取方法,方法包括:
获取目标场景的目标文本,目标场景对应预设数量个场景属性;
利用预先训练的位置确定模型确定场景属性对应的属性评价文本在目标文本中的位置,位置确定模型是基于用于识别两个文本之间的文本关联关系的关系确定模型训练生成的;
根据场景属性对应的属性评价文本在目标文本中的位置,提取场景属性对应的属性评论文本。
本发明实施例提供的文本提取方法,通过预先训练的位置确定模型,可以确定场景属性与目标文本之间的文本关联关系,还可以确定场景属性对应的属性评价文本在目标文本中的位置,并提取出场景属性对应的属性评价文本,基于场景属性与目标文本之间的文本关系,确定场景属性对应的属性评价文本在目标文本中的位置,有助于提升确定场景属性对应属性评价文本在目标文本中位置的准确率。由于确定出场景属性对应的属性评价文本,在根据场景属性对应的属性评价文本确定场景属性的属性评价态度时的准确率高于现有技术中根据目标文本确定场景属性的属性评价态度时的准确率。并且,无需训练多个不同场景属性的位置确定模型,节约了训练成本,缩短确定场景属性对应属性评价文本的处理过程。通过一个位置确定模型可以确定目标场景中多个场景属性的属性评价态度,位置确定模型具有更精细的处理能力,提升位置确定模型处理效率。
一种可能的实施方式中,本发明实施例提供的文本提取方法中,位置确定模型,采用如下步骤训练:
以目标场景的第一文本样本、设置的第一文本样本的场景属性标记、设置的场景属性对应的属性评论文本在第一文本样本中的位置,作为关系确定模型的输入,以场景属性对应的属性评论文本在第一文本样本中的位置作为关系确定模型的输出,对关系确定模型进行训练,将训练后的关系确定模型作为位置确定模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010773751.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于电缆沟检测的内窥镜装置
- 下一篇:一种医用婴儿体温测量器