[发明专利]一种错别词识别方法及装置在审
申请号: | 202111040352.6 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113761881A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 李萌;张少华;李勇乐;李昊 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/295 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 赵晓荣 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 错别词 识别 方法 装置 | ||
本申请实施例提供了一种错别词识别方法及装置。可以先接收并在页面的第一显示区域中显示用户输入的目标文本。可以对目标文本进行错别词识别,并在页面的第二显示区域中显示所述目标文本对应的错别词对列表。其中,错别词对列表可以包括一个或多个错别词对,每个错别词对可以包括目标文本中的错别词和用于对错别词进行纠错的正确词,错别词可以包括实体词和/或非实体词,实体词和非实体词是基于不同方式从目标文本中识别得到的。这样,可以准确地从目标文本中找到存在错误的错别词,并通过第二显示区域显示给用户,使得用户能够看到目标文本中存在的错别词。如此,用户能够方便快捷地对目标文本中的错别词进行处理。
技术领域
本申请涉及计算机领域,尤其涉及一种错别词识别方法及装置。
背景技术
随着计算机技术的发展,越来越多的人选择利用计算机代替手写对文本进行处理。这样,由于计算机具有便于修改等特点,利用计算机可以高效地对文本进行撰写、编辑和修改等操作,大大提高了办公效率。但是,计算机中的文本由用户手动输入,用户在输入或编辑文本时难免会存在疏漏,导致文本存在错别词。因此,亟需一种能够识别文本中错别词的方法。
发明内容
为了解决现有技术,本申请实施例提供了一种错别词识别方法及装置。
第一方面,本申请实施例提供了一种错别词识别方法,所述方法包括:
接收并在页面的第一显示区域中显示用户输入的目标文本;
在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。
第二方面,本申请实施例提供了一种错别词识别方法,所述方法包括:
获取目标文本;
将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错别词的句子,所述正确句为不包括错别词的句子;
比对所述目标文本和所述纠错文本,得到第一错别词对列表,所述第一错别词对列表包括所述目标文本中的第一错别词以及所述纠错文本中与所述第一错别词对应的第一正确词,所述第一错别词为非实体词;
从所述目标文本中识别多个实体词,根据所述多个实体词中任意两个实体词的相似度确定第二错别词对列表,所述第二错别词列表包括第二错别词和第二正确词,所述第二错别词和所述第二正确词均为实体词;
根据所述第一错别词对列表和所述第二错别词对列表得到所述目标文本的错别词对列表。
第三方面,本申请实施例提供了、一种错别词识别装置,所述装置包括:
获取模块,用于接收并在页面的第一显示区域中显示用户输入的目标文本;
显示模块,用于在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。
第四方面,本申请实施例提供了一种错别词识别装置,所述装置包括:
获取模块,用于获取目标文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111040352.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湖泊水体高精度监测系统
- 下一篇:一种壳体铸造用的增压铸造模具