[发明专利]一种错别词识别方法及装置在审
申请号: | 202111040352.6 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113761881A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 李萌;张少华;李勇乐;李昊 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/295 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 赵晓荣 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 错别词 识别 方法 装置 | ||
1.一种错别词识别方法,其特征在于,所述方法包括:
接收并在页面的第一显示区域中显示用户输入的目标文本;
在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述用户触发的错别词修改指令,确定所述错别词修改指令对应的目标错别词;
将所述目标文本中的所述目标错别词修改为对应的目标正确词。
3.根据权利要求2所述的方法,其特征在于,在将所述目标文本中的所述错别词修改为对应的所述正确词之前,所述方法还包括:
响应于所述用户在所述第二显示区域触发的错别词修改指令,跳转到所述目标文本中的所述目标错别词的显示位置,并突出显示所述目标错别词;或,
响应于所述用户点击所述错别词触发的跳转指令,跳转到所述目标文本中的所述目标错别词的显示位置,并突出显示所述目标错别词。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于所述用户触发的错别词一键修改指令,将所述错别词对列表包括的所述一个或多个错别词修改为对应的正确词。
5.根据权利要求1所述的方法,其特征在于,所述目标文本包括N个段落,对应地,所述第二显示区域包括N个显示子区域,N为大于1的整数;
所述在所述页面的第二显示区域显示所述目标文本的错别词对列表,包括:
在所述第二显示区域的各所述显示子区域显示该子区域对应的所述段落的错别词对列表。
6.根据权利要求1所述的方法,其特征在于,所述第二显示区域包括第一子显示区域和第二子显示区域,所述第一子显示区域用于显示包括所述实体词的错别词对,所述第二子显示区域用于显示包括所述非实体词的错别词对。
7.根据权利要求1所述的方法,其特征在于,所述错别词包括第一错别词,所述方法还包括:
在所述第一显示区域中高亮显示所述第一错别词;
响应于所述用户对所述第一错别词触发的显示指令,显示所述第一错别词对应的第一正确词;
响应于所述用户触发的修改操作,将所述目标文本中的所述第一错别词替换为所述第一正确词;
删除所述错别词对列表中的所述第一错别词和所述第一正确词。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第二显示区域显示所述错别词在所述目标文本中出现的频次。
9.一种错别词识别方法,其特征在于,所述方法包括:
获取目标文本;
将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错别词的句子,所述正确句为不包括错别词的句子;
比对所述目标文本和所述纠错文本,得到第一错别词对列表,所述第一错别词对列表包括所述目标文本中的第一错别词以及所述纠错文本中与所述第一错别词对应的第一正确词,所述第一错别词为非实体词;
从所述目标文本中识别多个实体词,根据所述多个实体词中任意两个实体词的相似度确定第二错别词对列表,所述第二错别词列表包括第二错别词和第二正确词,所述第二错别词和所述第二正确词均为实体词;
根据所述第一错别词对列表和所述第二错别词对列表得到所述目标文本的错别词对列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111040352.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湖泊水体高精度监测系统
- 下一篇:一种壳体铸造用的增压铸造模具