[发明专利]标点符号的校正方法及设备、介质在审

专利信息
申请号: 201910927419.4 申请日: 2019-09-27
公开(公告)号: CN110705264A 公开(公告)日: 2020-01-17
发明(设计)人: 沈大框;陈培华;陈成才 申请(专利权)人: 上海智臻智能网络科技股份有限公司
主分类号: G06F40/232 分类号: G06F40/232
代理公司: 31327 上海知锦知识产权代理事务所(特殊普通合伙) 代理人: 潘彦君
地址: 201803 上海市嘉*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 标点符号的校正方法及设备、介质,所述方法包括:对待校正的文本进行去标点符号处理,得到待添加标点符号的文本;将所述待添加标点符号的文本输入完成迁移学习训练的标点符号标注模型,采用所述标点符号标注模型预测所述待添加标点符号的文本中的标点符号待添加位置及对应标点符号类型,并在所述标点符号待添加位置的前后分词单元处,采用所述标点符号类型对应的标签组合进行标注,输出对应的标点符号标注结果;根据所述标点符号标注结果,对所述待添加标点符号的文本添加相应的标点符号,得到相应的校正文本。上述方案可以提高标点符号预测的准确率,满足标点符号校正的需求。
搜索关键词: 标点符号 文本 标注 校正 添加位置 标签组合 分词单元 模型预测 输入完成 学习训练 准确率 迁移 输出 预测
【主权项】:
1.一种标点符号的校正方法,其特征在于,包括:/n对待校正的文本进行去标点符号处理,得到待添加标点符号的文本;/n将所述待添加标点符号的文本输入完成迁移学习训练的标点符号标注模型,采用所述标点符号标注模型预测所述待添加标点符号的文本中的标点符号待添加位置及对应标点符号类型,并在所述标点符号待添加位置的前后分词单元处,采用所述标点符号类型对应的标签组合进行标注,输出对应的标点符号标注结果;/n根据所述标点符号标注结果,对所述待添加标点符号的文本添加相应的标点符号,得到相应的校正文本;/n其中,所述标点符号标注模型包括预训练的语言子模型,所述语言子模型为具有时间序列的神经网络模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910927419.4/,转载请声明来源钻瓜专利网。

同类专利
  • 语音识别文本的纠错方法、装置、计算机设备和存储介质-201910903618.1
  • 宁义双;张良杰;闵刚 - 金蝶软件(中国)有限公司
  • 2019-09-24 - 2020-02-07 - G06F40/232
  • 本申请涉及一种语音识别文本的纠错方法、装置、计算机设备和存储介质。所述方法包括:利用预设的语言模型获取语音识别文本的流畅度,其中,所述预设的语言模型利用第一语料库和第二语料库的语料训练得到,所述第一语料库包括通用场景的语料,所述第二语料库包括预设场景的语料;若所述语音识别文本的流畅度小于流畅阈值,获取所述语音识别文本中的待纠错词;从纠错数据库中确定所述待纠错词对应的纠正词,根据所述纠正词得到纠正后的语音识别文本。本申请提高了对用户意图识别的准确率。
  • 文本纠错方法、电子设备和计算机可读介质-201911013597.2
  • 姚莲 - 上海连尚网络科技有限公司
  • 2019-10-23 - 2020-02-07 - G06F40/232
  • 本申请实施例公开了文本纠错方法、电子设备和计算机可读介质。该文本纠错方法的一具体实施方式包括:响应于接收到发送端提交的即时通讯消息,确定即时通讯消息是否需要纠错;若确定出即时通讯消息需要纠错,向发送端发送纠错提示,其中,纠错提示包括对即时通讯消息纠错后的消息;基于发送端返回的、用于指示是否纠错的指令,将即时通讯消息或纠错后的消息推送到与发送端进行即时通讯的接收端。该实施方式能够在判断出用户发送的即时通讯消息有拼写、语法等错误内容时进行纠错提示,以便用户选择发送纠正后的内容,提高了即时通讯消息的准确性,提升了会话双方的沟通效率。
  • 一种法律文书的纠错方法、装置、存储介质及处理器-201810724068.2
  • 杨丹 - 北京国双科技有限公司
  • 2018-07-04 - 2020-02-04 - G06F40/232
  • 本发明公开了一种法律文书的纠错方法,包括:获取待处理法律文书;对所述待处理法律文书中的错误点进行识别,所述错误点的类别包括文书格式错误、错别字、标点及符号错误、文书书写表述错误、法律依据引用错误和诉讼人员姓名错误中的至少一种;对所述待处理法律文书中的每个错误点进行标注,生成并显示每个错误点的修改提示。本发明实现了对法律文书中各种类型错误点的识别、错误点标注和修改提示,提高了法务人员处理法律文书的质量和效率。
  • 纠错词典创建方法、装置、终端及计算机存储介质-201910861642.3
  • 吴上权;周蓝珺;潘树燊 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2019-09-12 - 2020-01-31 - G06F40/232
  • 本发明实施例提供了一种纠错词典构建方法、装置、终端及计算机存储介质,其中,所述方法包括:获取检索数据及所述检索数据对应的平行语料;对所述检索数据以及所述平行语料进行扩展,得到检索词汇集合和语料词汇集合;从所述检索词汇集合和所述语料词汇集合中查询具备映射关系的词汇对;根据所述词汇对构建所述检索数据对应的纠错词典。采用本发明实施例,能够解决现有技术中存在的纠错词典中词汇对较少、构建效率较低等问题。
  • 一种字符信息的录入校验方法和存储介质-201910914952.7
  • 张龙;赵霖;李瑜;赵坚 - 福建榕基软件工程有限公司
  • 2019-09-26 - 2020-01-17 - G06F40/232
  • 本发明提供了一种字符信息的录入校验方法和存储介质,所述方法还包括:接收输入字符信息和输入校验信息;根据所述输入字符信息计算实时校验信息,比对所述实时校验信息与所述输入校验信息是否一致,若一致则校验通过,否则校验不通过。由于实时校验信息是根据输入的字符信息实时计算的,当输入字符信息有错时,其对应的实时校验信息也会与输入校验信息不同,校验将不会被通过,从而有效提高了输入字符信息录入的准确性。
  • 标点符号的校正方法及设备、介质-201910927419.4
  • 沈大框;陈培华;陈成才 - 上海智臻智能网络科技股份有限公司
  • 2019-09-27 - 2020-01-17 - G06F40/232
  • 标点符号的校正方法及设备、介质,所述方法包括:对待校正的文本进行去标点符号处理,得到待添加标点符号的文本;将所述待添加标点符号的文本输入完成迁移学习训练的标点符号标注模型,采用所述标点符号标注模型预测所述待添加标点符号的文本中的标点符号待添加位置及对应标点符号类型,并在所述标点符号待添加位置的前后分词单元处,采用所述标点符号类型对应的标签组合进行标注,输出对应的标点符号标注结果;根据所述标点符号标注结果,对所述待添加标点符号的文本添加相应的标点符号,得到相应的校正文本。上述方案可以提高标点符号预测的准确率,满足标点符号校正的需求。
  • 文书评审的校对方法及装置、存储介质、电子设备-201910886011.7
  • 郑立颖;徐亮;阮晓雯 - 平安科技(深圳)有限公司
  • 2019-09-18 - 2020-01-10 - G06F40/232
  • 本公开提供了一种文书评审的校对方法及装置,属于相似度匹配技术领域,该方法包括:获取待校对文书,并将所述待校对文书按照预定规则进行拆分,以得到校对模板;获取针对所述待校对文书的条款目录中条款的标注信息,并将所述标注信息按照所述预定规则进行拆分,以得到待校对文本;将所述校对模板和与其相对应的所述待校对文本进行对比;当所述校对模板和与其相对应的所述待校对文本的内容一致时,则确定所述待校对文本为正确标注。该方法提高了文书评审校对的效率,降低了校对成本。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top