[发明专利]文本录入方法及装置在审
申请号: | 201811609497.1 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109614598A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 徐星宇 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 录入 非文本信息 文本信息 目标文本 文本录入 文本内容 策略提取 获取目标 预设 文本 | ||
本公开提出一种文本录入方法及装置,其中,方法包括:获取目标文本中的文本内容,并根据预设的提取策略提取文本内容中的文本信息和非文本信息;根据第一录入策略录入文本信息,并根据第二录入策略录入非文本信息,以实现对目标文本的录入。该方法可以将目标文本的文本信息和非文本信息以相应录入策略录入,提高录入的准确性,有效避免出现录入错误的同时,提高录入的适用性,有效提升录入效率和录入体验,简单易实现。
技术领域
本公开涉及文本处理技术领域,特别涉及一种文本录入方法及装置。
背景技术
相关技术,在对具有非文本信息的文本进行录入时,录入人员通常将文本中的文本信息和非文本信息分开进行录入。
然而,以人工录入方式对文本进行录入时,容易出现录入误差,降低录入的准确性,尤其是在录入非文本信息时,一旦录入人员对非文本信息的专业度不够,不但会增加录入时间,降低录入效率,而且易造成录入错误,导致录入具有一定局限性,大大降低录入的适用性,降低录入体验。
发明内容
本公开提供一种文本录入方法及装置,可以有效提高录入的准确性,并在有效避免出现录入错误的同时,提高录入的适用性,有效提升录入效率和录入体验,简单易实现。
本公开第一方面实施例提出了一种文本录入方法,包括以下步骤:获取目标文本中的文本内容,并根据预设的提取策略提取所述文本内容中的文本信息和非文本信息;根据第一录入策略录入所述文本信息,并根据第二录入策略录入所述非文本信息,以实现对所述目标文本的录入。
在本公开的一个实施例中,所述根据第二录入策略录入所述非文本信息,进一步包括:识别所述非文本信息的信息特征;根据所述信息特征获取所述非文本信息的信息类型,以匹配所述第二录入策略。
在本公开的一个实施例中,在识别所述非文本信息的信息特征之前,还包括:判断所述文本内容是否存在所述非文本信息;如果存在所述非文本信息,则识别所述非文本信息的信息特征。
在本公开的一个实施例中,还包括:根据所述非文本信息的信息类型匹配第一展现策略;根据所述第一展现策略展现所述非文本信息。
在本公开的一个实施例中,还包括:根据第二展现策略展现所述文本信息。
本公开实施例的文本录入方法,可以将目标文本的文本信息和非文本信息以相应录入策略录入,实现目标文本的录入,从而可以有效提高录入的准确性,并在有效避免出现录入错误的同时,提高录入的适用性,有效提升录入效率和录入体验,简单易实现。
为达上述目的,本公开第二方面实施例提出了一种文本录入装置,包括:获取模块,用于获取目标文本中的文本内容,并根据预设的提取策略提取所述文本内容中的文本信息和非文本信息;录入模块,用于根据第一录入策略录入所述文本信息,并根据第二录入策略录入所述非文本信息,以实现对所述目标文本的录入。
在本公开的一个实施例中,在本公开的一个实施例中,还包括:判断模块,用于在提取所述文本内容中的文本信息和非文本信息之前,判断所述文本内容是否存在所述非文本信息,以在不存在所述非文本信息时,所述录入模块根据所述第一录入策略录入所述文本信息。
在本公开的一个实施例中,所述录入模块包括:识别单元,用于识别所述非文本信息的信息特征;匹配单元,用于根据所述信息特征获取所述非文本信息的信息类型,以匹配所述第二录入策略。
本公开实施例的文本录入装置,可以将目标文本的文本信息和非文本信息以相应录入策略录入,实现目标文本的录入,从而可以有效提高录入的准确性,并在有效避免出现录入错误的同时,提高录入的适用性,有效提升录入效率和录入体验,简单易实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811609497.1/2.html,转载请声明来源钻瓜专利网。