[发明专利]文本处理方法、装置、设备、介质和程序产品在审
申请号: | 202210012052.5 | 申请日: | 2022-01-06 |
公开(公告)号: | CN114707486A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 林勇;刘捷;魏梦菲;原普雨;贾丰华 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李世阳 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 设备 介质 程序 产品 | ||
1.一种文本处理方法,包括:
构建存量文本资产库,所述存量文本资产库中存储的存量文本标注有文本特征;
响应于用户输入的文本特征,从所述存量文本资产库中选取与所述文本特征相应的存量文本;
对所述存量文本进行文本优化,输出优化后的存量文本。
2.根据权利要求1所述的方法,所述构建存量文本资产库包括:
获取软件开发过程中涉及的所有原始文本;
提取每个所述原始文本的文本特征;
将每个所述原始文本的文本特征标注在对应的原始文本上;
基于标注有文本特征的所有原始文本,得到所述存量文本资产库。
3.根据权利要求1所述的方法,所述方法还包括:
将所述优化后的存量文本替代与所述文本特征相应的存量文本存入所述存量文本资产库。
4.根据权利要求1至3任意一项所述的方法,所述对所述存量文本进行文本优化,输出优化后的存量文本包括:
获取所述存量文本的句法成分;
判断所述存量文本的句法成分是否包含所有指定句法成分;
若所述存量文本的句法成分缺少指定句法成分,则填补缺少的所述指定句法成分的词语。
5.根据权利要求1至3任意一项所述的方法,所述对所述存量文本进行文本优化,输出优化后的存量文本包括:
获取所述存量文本的句法成分;
判断所述存量文本的句法成分是否存在所有禁止句法成分;
若所述存量文本的句法成分存在所述禁止句法成分,则删除所述存量文本中的所述禁止句法成分对应的语句。
6.根据权利要求1至3任意一项所述的方法,所述对所述存量文本进行文本优化,输出优化后的存量文本包括:
获取所述存量文本的所有词语的词性;
判断所述存量文本的所有词语的词性是否存在禁止词性;
若所述存量文本的所有词语的词性存在所述禁止词性,则删除所述存量文本中所述禁止词性对应的词语。
7.根据权利要求1至3任意一项所述的方法,所述对所述存量文本进行文本优化,输出优化后的存量文本之后,包括:
向所述用户展示所述优化后的存量文本;
响应于所述用户对所述优化后的存量文本的修改,获取用户修改后的存量文本;
将所述修改后的存量文本替代与所述文本特征相应的存量文本存入所述存量文本资产库。
8.一种文本处理装置,包括:
构建模块,用于构建存量文本资产库,所述存量文本资产库中存储的存量文本标注有文本特征;
选取模块,用于响应于用户输入的文本特征,从所述存量文本资产库中选取与所述文本特征相应的存量文本;
优化模块,用于对所述存量文本进行文本优化,输出优化后的存量文本。
9.根据权利要求8所述的装置,所述构建模块包括:
获取子模块,用于获取软件开发过程中涉及的所有原始文本;
提取子模块,用于提取每个所述原始文本的文本特征;
标注子模块,用于将每个所述原始文本的文本特征标注在对应的原始文本上;
构建子模块,用于基于标注有文本特征的所有原始文本,得到所述存量文本资产库。
10.根据权利要求8所述的装置,所述装置还包括:
存入模块,用于将所述优化后的存量文本替代与所述文本特征相应的存量文本存入所述存量文本资产库。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210012052.5/1.html,转载请声明来源钻瓜专利网。