[发明专利]文本重组方法、装置、终端设备及计算机可读存储介质有效
申请号: | 201710403566.2 | 申请日: | 2017-06-01 |
公开(公告)号: | CN108984071B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 阮闪闪;钱成;罗根;蔡元锋;李杨;王波;许耀峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F3/0483;G06F3/04812;G06F3/04842;G06F40/289;G06F40/30 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 重组 方法 装置 终端设备 计算机 可读 存储 介质 | ||
1.一种文本重组方法,其特征在于,所述方法包括:
响应于显示界面上的文本选择操作,确定待重组文本;
调用正则表达式扫描所述待重组文本,并利用扫描到的词或词组与字典中的语义块进行匹配;
若匹配到,则将所述词或词组划分为第一类别的语义块,且利用与所述词或词组匹配的语义块的频数计算所述第一类别的语义块的概率;
若未匹配到,且所述词或词组的语言类型与所述字典的语言类型不一致,则确定所述词或词组为第二类别的语义块,并利用马尔科夫模型中的维比特算法计算所述第二类别的语义块的概率;
按照所述第一类别的语义块和/或所述第二类别的语义块在所述待重组文本中的位置,构建所有可能的有向无环图,得到有向无环图的初始集合;
利用逆向比较语义块的概率的方式从所述集合中选择满足预设条件的有向无环图,显示选择的有向无环图中的语义块,其中,所述语义块的概率基于所述语义块在所述字典中的频数得到;
响应于对所述语义块的重组操作,按照所述重组操作确定的目标语义块的排列顺序显示所述目标语义块,以重组为新的文本。
2.根据权利要求1所述的方法,其特征在于,所述显示界面包含第一显示区域及第二显示区域,所述第一显示区域用于显示分词处理得到的多个语义块;
则所述响应于对所述语义块的重组操作,按照所述重组操作确定的目标语义块的排列顺序显示所述目标语义块的步骤包括:
响应于对所述第一显示区域内的语义块的选择操作,将选择的语义块作为目标语义块,并按照对所述目标语义块的选择顺序或光标所在位置在所述第二显示区域内显示所述目标语义块。
3.根据权利要求2所述的方法,其特征在于,所述第二显示区域内显示的目标语义块包含删除标记;
所述响应于对所述语义块的重组操作,按照所述重组操作确定的目标语义块的排列顺序显示所述目标语义块的步骤还包括:
响应于对所述第二显示区域内的目标语义块的删除标记的点击操作,按照所述点击操作删除指定的目标语义块。
4.根据权利要求2所述的方法,其特征在于,所述响应于对所述语义块的重组操作,按照所述重组操作确定的目标语义块的排列顺序显示所述目标语义块的步骤还包括:
响应于对所述第二显示区域内的目标语义块的拖动操作,基于所述拖动操作拖动的目标语义块的实时位置,确定所述目标语义块的可插入位置,并在所述可插入位置显示所述目标语义块的虚拟语义块;
检测到所述拖动操作结束时,判断所述目标语义块与所述虚拟语义块的重叠区域是否大于或等于预设值;
若大于或等于预设值,则利用所述目标语义块替换所述虚拟语义块。
5.根据权利要求1所述的方法,其特征在于,所述利用逆向比较语义块的概率的方式从所述集合中选择满足预设条件的有向无环图,显示选择的有向无环图中的语义块的步骤包括:
比较第m个集合中有向无环图逆向的第i个节点的语义块的概率,i、m为正整数,且i、m的初始值为1,且第1个集合为所述初始集合;
若在逆向的所述第i个节点的语义块中,仅有一个语义块的概率最大,则确定概率最大的语义块所在的有向无环图为所述满足预设条件的有向无环图;
若在逆向的所述第i个节点的语义块中,有至少两个语义块的概率最大,则将概率最大的至少两个语义块分别所在的有向无环图作为第m+1个集合,且令i=i+1,m=m+1,返回所述比较第m个集合中有向无环图逆向的第i个节点的语义块的概率的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710403566.2/1.html,转载请声明来源钻瓜专利网。