[发明专利]一种中文文本多字自动检测识别的实现方法在审
申请号: | 202111204752.6 | 申请日: | 2021-10-15 |
公开(公告)号: | CN113935313A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 孟奥;王宁;张发雨;党章;吴兴龙;冯立二;杨正云 | 申请(专利权)人: | 江苏省未来网络创新研究院 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/126 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 蒋真 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种中文文本多字自动检测识别的实现方法,其特征在于,包括对中文文本的整体处理流程和对中文短句的具体处理流程,具体包括运行开始,随机输入中文文本,对中文文本进行utf‑8统一编码处理,然后根据标点符号切分中文文本,输出切分后的短句列表,循环处理中文短句列表中的每个中文短句,获取中文短句中可能的多字和多字位置信息等,然后判断中文短句列表是否全部处理,如否则继续循环处理中文短句列表中的每个中文短句,如是则将所有短句中可能存在的多字信息整理后输出,运行结束。本发明实现了提前查看中文文本是否错字、多字,解决了人工查看费事费力的问题,大大减少了人力成本;适用于各种中文文本中,具有广泛的应用前景。 | ||
搜索关键词: | 一种 中文 文本 多字 自动检测 识别 实现 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省未来网络创新研究院,未经江苏省未来网络创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111204752.6/,转载请声明来源钻瓜专利网。
- 上一篇:远程考试监测系统、方法、设备及存储介质
- 下一篇:连接结构及家具