[发明专利]一种文本录入点定位方法及计算机可读存储介质在审

专利信息
申请号: 201711251952.0 申请日: 2017-12-01
公开(公告)号: CN108170668A 公开(公告)日: 2018-06-15
发明(设计)人: 朱敬华;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤 申请(专利权)人: 厦门快商通信息技术有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06N3/04
代理公司: 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 代理人: 乐珠秀
地址: 361007 福建省厦门*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及文本处理技术领域,本发明提供了一种文本录入点定位方法,所述方法包含步骤:将文本内容转换成多个序列;基于预设神经网络模型对所述各个序列进行计算,分别获得各个所述序列对应的输出值;根据所述输出值确定录入点位置。本发明所提供的技术方案,借助预先训练得到的神经网络模型可获知文本中的录入点的位置,并且可通过对识别信息的设置,可根据输出值确定该输入值即序列中是否包含录入点,以及所包含的录入信息的类型;由于序列拆分的方法可根据实际需求进行设定,故可通过对文本内容拆分方法的调整以及实际需求来确定录入点定位。 1
搜索关键词: 录入 点定位 神经网络模型 实际需求 文本录入 文本内容 输出 计算机可读存储介质 录入信息 文本处理 点位置 获知 预设 文本 转换
【主权项】:
1.一种文本录入点定位方法,其特征在于,所述方法包含步骤:

将文本内容转换成多个序列;

基于预设神经网络模型对所述各个序列进行计算,分别获得各个所述序列对应的输出值;

根据所述输出值确定录入点位置。

2.如权利要求1所述的文本录入点定位方法,其特征在于,所述将文本内容转换成多个序列的方法包含按照句式结构对所述文本内容进行转换。

3.如权利要求1所述的文本录入点定位方法,其特征在于,所述将文本内容转换成多个序列的方法包含按照内容特征对所述文本内容进行转换。

4.如权利要求1所述的文本录入点定位方法,其特征在于,获得所述预设神经网络模型的训练方法包含步骤:

准备训练样本文本;

从所述样本中提取输入值,并设定每个输入值对应的输出值;

选取神经网络算法;

基于所述训练样本,对所述神经网络算法进行训练,获得所述预设神经网络模型。

5.如权利要求4所述的文本录入点定位方法,其特征在于,所述训练样本与所述文本类型相同,所述输入值的提取方法与所述文本内容转换成多个序列的方法相同。

6.如权利要求4所述的文本录入点定位方法,其特征在于,所述设定每个输入值对应的输出值的方法包含:

设定标识录入点的识别信息;

判断所述输入值中是否包含所述识别信息;

根据所述判断结果和预设数据格式,获得所述对应的输出值。

7.如权利要求6所述的文本录入点定位方法,其特征在于,所述文本类型为合同,所述识别信息包含合同事项、合同金额、付款条件及付款进度、收款方信息、合同有效期中的一项或者多项。

8.如权利要求4所述的文本录入点定位方法,其特征在于,所述神经网络算法包括RNN神经网络算法。

9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的文本录入点定位方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息技术有限公司,未经厦门快商通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711251952.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top