[发明专利]文本处理方法、模型的训练方法、装置、设备及存储介质有效
申请号: | 202011479376.7 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112528674B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 汪硕芃;张荣升;黄诗磊;张聪;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/166;G06F40/242;G06F40/279;G06F16/174;G06F16/36 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种文本处理方法、模型的训练方法、装置、设备及存储介质,涉及数据处理技术领域。该文本处理方法,包括:获取待处理的文本;根据待处理的文本,采用预先训练获取的文本处理模型,得到待处理的文本对应的文本编辑操作序列,文本编辑操作序列为待处理的文本中各字符所组成的序列,序列中包括每个字符所需执行的编辑操作的标识,文本处理模型使用标记有文本编辑操作序列标签的样本文本训练得到,文本编辑操作序列标签根据样本文本以及样本文本对应的标注目标文本得到;根据文本编辑操作序列,得到待处理的文本对应的目标文本,目标文本包括待处理的文本对应的压缩文本或改写文本。本方案得到的待处理的文本的目标文件可读性较高。 | ||
搜索关键词: | 文本 处理 方法 模型 训练 装置 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011479376.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种防堵塞环保工业废水净化装置
- 下一篇:自然语言处理方法、装置及电子设备