[发明专利]文本处理装置、方法、设备和计算机可读存储介质在审

专利信息
申请号: 202110609227.6 申请日: 2021-06-01
公开(公告)号: CN115438174A 公开(公告)日: 2022-12-06
发明(设计)人: 张斯曼;郭垿宏;中村一成;李安新;陈岚;藤本拓;吉村健 申请(专利权)人: 株式会社NTT都科摩
主分类号: G06F16/34 分类号: G06F16/34;G06F16/35;G06F40/166;G06N3/08
代理公司: 北京市柳沈律师事务所 11105 代理人: 张晓明
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 处理 装置 方法 设备 计算机 可读 存储 介质
【说明书】:

本公开涉及一种文本处理装置、方法、设备和计算机可读存储介质。该文本处理装置包括:用户数据获取模块,用于获取多个用户的用户数据;以及训练模块,用于利用所述多个用户的用户数据对第一模型进行训练以获得针对不同类别的目标模型,其中,所述第一模型用于基于第一待提取摘要文本和用户行为信息,生成目标摘要文本。

技术领域

本公开涉及文本处理领域,并且具体涉及一种文本处理装置、方法、设备和计算机可读存储介质。

背景技术

文本摘要提取指的是将一段有明确含义的文本内容进行高度的概括和抽象,生成文本的摘要。对于摘要,每个用户关注的重点不同且期望的语言风格(例如,用词、语序等)可能不同,因此,期望能够通过方便的用户交互或者用户设定,获得或者修改原始系统生成的摘要以获得用户期望的摘要。

发明内容

鉴于以上问题,本公开提供了一种文本处理装置、方法、设备和计算机可读存储介质。

根据本公开的一个方面,提供了一种文本处理装置,用于通过文本处理来提取摘要,所述装置包括:用户数据获取模块,用于获取多个用户的用户数据;以及训练模块,用于利用所述多个用户的用户数据对第一模型进行训练以获得针对不同类别的目标模型,其中,所述第一模型用于基于第一待提取摘要文本和用户行为信息,生成目标摘要文本。

根据本公开的一个示例,所述用户数据获取模块根据第一预定规则将所述多个用户的用户数据分类为多个数据类别,所述训练模块利用所述多个用户的用户数据对所述第一模型进行训练以获得针对所述多个数据类别的目标模型,其中,所述第一预定规则与用户行为有关。

根据本公开的一个示例,所述第一预定规则是聚类规则或回归规则。

根据本公开的一个示例,所述训练模块利用所述多个用户的用户数据对所述第一模型进行训练以获得针对所述多个用户中的每一个用户的目标模型。

根据本公开的一个示例,所述多个用户的用户数据表示预定时段的用户数据。

根据本公开的一个示例,所述装置还包括筛选模块,用于根据用户反馈对获取的所述多个用户的用户数据进行筛选,以使得所述训练模块利用筛选后的多个用户的用户数据对所述第一模型进行训练来获得针对不同类别的目标模型,其中所述用户反馈包括直接反馈和间接反馈。

根据本公开的一个示例,所述筛选模块将与所述用户反馈有关的特征和所述多个用户的用户数据的特征进行加权打分,以获得具有不同得分的、筛选后的多个用户的用户数据。

根据本公开的一个示例,所述筛选模块对所有用户使用相同的权重,以将与所述用户反馈有关的特征和所述多个用户的用户数据的特征进行加权打分,来获得筛选后的多个用户的用户数据。

根据本公开的一个示例,所述筛选模块对不同用户使用不同的权重,以将与所述用户反馈有关的特征和所述多个用户的用户数据的特征进行加权打分,来获得筛选后的多个用户的用户数据。

根据本公开的一个示例,所述文本处理装置还包括:第一待提取摘要文本获取模块,用于获取所述第一待提取摘要文本;用户行为信息获取模块,用于获取用户行为信息;以及处理模块,用于利用第一模型处理所述第一待提取摘要文本,以得到中间文本,并基于获取的用户行为信息处理所述中间文本以生成目标摘要文本。

根据本公开的一个示例,在所述用户行为信息获取模块获取的用户行为信息为删除所述中间文本中的第一特定内容的情况下,所述处理模块直接删除所述中间文本中的第一特定内容以生成目标摘要文本;以及在所述用户行为信息获取模块获取的用户行为信息为修改所述中间文本中的第一特定内容的情况下,所述处理模块向所述用户提供替换所述第一特定内容的候选推荐内容以供用户选择,并使用所述用户选择的候选推荐内容替换所述第一特定内容以生成目标摘要文本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社NTT都科摩,未经株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110609227.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top