[发明专利]一种多源Markdown地质资料文本格式规范化方法及系统在审

申请号：	202110022101.9	申请日：	2021-01-08
公开（公告）号：	CN112699636A	公开（公告）日：	2021-04-23
发明（设计）人：	邓吉秋;夏晨晨;刘文毅;雷玉娇;何美香;路馥毓	申请（专利权）人：	中南大学
主分类号：	G06F40/12	分类号：	G06F40/12
代理公司：	长沙智路知识产权代理事务所(普通合伙) 43244	代理人：	张毅
地址：	410000 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种多源Markdown地质资料文本格式规范化方法及系统，所述方法包括：S1、根据预先设定的文本清理判断规则，判断文本中任一行文本是否符合清理判断准则，获取判断结果；所述文本清理判断规则包括：第一级规则为规定清理判断准则进行判断的顺序的优先级规则；第二级规则为清理判断准则，用于判断文本是否符合清理判断准则；S2、根据所述判断结果和预先设定文本清理判断规则及规范化处理方法，进行规范处理，获取规范文本；所述规范化处理方法与所述文本清理判断规则对应，解决了对Markdown格式地质资料文本格式规范化处理需要有经验的操作人员才能完成，且速度慢、效率低、无法避免人为疏忽带来的判断错误的问题。
搜索关键词：	一种 markdown 地质资料文本格式规范化方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中南大学，未经中南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202110022101.9/，转载请声明来源钻瓜专利网。

上一篇：一种生物材料制剂脱漆剂
下一篇：一种用于制冷压缩机方便拆装的转子座

同类专利

将根据模式以人类可读的文本格式化的数据编码为二进制-201811229535.0
发明人： W·谢勒三世;J·R·希兰;M·R·加勒特 -专利权人：慧与发展有限责任合伙企业
申请日： 2018-10-22 - 公布日： 2023-10-20 - 主分类号： G06F40/12
摘要：本发明涉及将根据模式以人类可读的文本格式化的数据编码为二进制。数据被组织在具有节点的分层数据树中，并且根据模式以人类可读的数据被格式化。与从模式生成的模式词典的规范排序一致地对数据进行规范排序。将规范排序的数据编码为二进制，包括：对于每个节点，移除节点的标签，以及以二进制方式添加与规范排序相对应的节点的序列号。

一种翻译文本检错方法及装置-202010117638.9
发明人：胡茂力 -专利权人：网易（杭州）网络有限公司
申请日： 2020-02-25 - 公布日： 2023-09-26 - 主分类号： G06F40/12
摘要：本发明实施例提供了一种翻译文本检错方法及装置，应用于第一终端，所述第一终端与翻译平台和第二终端通信连接，所述方法包括：接收所述第二终端发送的检查规则；根据所述检查规则生成检查工具；接收所述第二终端发送的针对预设翻译产品的待翻译文本；对所述待翻译文本进行翻译，得到目标翻译文本；采用所述检查工具检查所述目标翻译文本是否存在错误；若所述目标翻译文本不存在错误，则将所述目标翻译文本上传至所述翻译平台。通过第二终端将检查规则发送至第一终端，由第一终端根据检测规则生成检测工具，使得后续可以采用该检测工具对翻译得到的目标翻译文本进行检查，保证目标翻译文本在交付前的质量问题。

一种Excel模型的解析方法及系统-202211138089.9
发明人：胡凯;孙小强;白雪 -专利权人：长沙丹渥智能科技有限公司
申请日： 2022-09-19 - 公布日： 2023-09-08 - 主分类号： G06F40/12
摘要：本发明提供一种Excel模型的解析方法及系统，所述方法包括：获取待解析的Excel模型文件，待解析的Excel模型文件包括多个单元格；提取每个单元格的特征属性和依赖关系；根据特征属性和预设的匹配模式从全部单元格中确定目标表格，目标表格包括目标单元格；根据目标单元格的特征属性和依赖关系确定业务指标和指标关系。本发明的Excel模型的解析方法，基于单元格属性和依赖关系来辅助推断Excel模型中有业务关联的区域，应用近邻移动匹配算法进行特征属性识别，能够更加完整的识别Excel模型关系，完整解析Excel模型中的关键业务信息，快速解析出Excel模型结构。

一种自动切换号段的方法和装置-201910406057.4
发明人：郝建伟 -专利权人：北京京东振世信息技术有限公司
申请日： 2019-05-16 - 公布日： 2023-09-05 - 主分类号： G06F40/12
摘要：本发明公开了一种自动切换号段的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：根据第一号段规则，生成当前号码，记录所述当前号码的日志并更新最大号码的记录，将所述最大号码存入缓存；若从缓存中获取的所述最大号码超出第一号段规则的预警阈值，则根据号段配置规则中的号段配置信息确定第二号段规则；若从缓存中获取的所述最大号码为根据第一号段规则生成的最后一个号码，则将所述第二号段规则作为新的第一号段规则。该实施方式克服了能够解决在人工去切换号段或者通过配置方式去更改规则的过程中，出现的老号段利用率不足和新老号段切换不及时甚至失败的技术问题，达到平滑无感知切换的技术效果。

一种实现PDF和OFD文档多页连续盖章操作的方式方法-202310285955.5
发明人：刘师学;张海洋;李颖 -专利权人：北京安证通信息科技股份有限公司
申请日： 2023-03-22 - 公布日： 2023-08-08 - 主分类号： G06F40/12
摘要：本发明涉及文档连续盖章技术领域，具体公开了一种实现PDF和OFD文档多页连续盖章操作的方式方法，包括以下步骤：步骤A001：打开文档，作出签章命令，加载PDF文档数据流，解析PDF文档；步骤A002：响应签章请求，读取PDF文档的盖章位置、盖章页码范围和所需印章图片；步骤A003：设置盖章模式，在对应的盖章模式下实现连续盖章以及改变位置盖章。本方法解决传统的文档连续盖章时，无法改变盖章位置的问题。

基于文本改写模型的隐写文本生成方法-202310319597.5
发明人：董云云;李钒效;巫思杏;周维 -专利权人：云南大学
申请日： 2023-03-29 - 公布日： 2023-07-21 - 主分类号： G06F40/12
摘要：本发明公开了一种基于文本改写模型的隐写文本生成方法，采用预训练降噪自编码模型BART完成文本改写任务，对数据集进行数据增强构建了微调数据集对模型进行微调，利用条件限制编码进行二次微调来控制输出文本的长度。在信息嵌入阶段，设计了掩码策略进行秘密信息的嵌入，并采用重排序方式来选择最优隐写文本。相较于现有技术，本发明所提出的方法能够保证隐写文本的可控性以及自然性，较现存方法能够生成更自然流畅的语句。

中文通用语言的生成方法、装置、设备及存储介质-202310348704.7
发明人：屈鑫;张亚林;高笑天;叶永青 -专利权人：上海燧原科技有限公司
申请日： 2023-04-04 - 公布日： 2023-07-07 - 主分类号： G06F40/12
摘要：本发明涉及自然语言处理技术领域，公开了一种中文通用语言的生成方法、装置、设备及存储介质。该方法包括：获取用户输入的风格提示符、中文文本前缀和文本生成长度；将用户输入的风格提示符、中文文本前缀和文本生成长度输入至预训练的目标语言模型，获取目标语言模型输出的续写文本；其中，目标语言模型基于生成式预训练网络建立；对续写文本进行展示。本实施例的技术方案，通过基于生成式预训练网络建立可以生成中文通用语言的语言模型，可以基于单一语言模型实现对不同风格的中文语言的自动生成，可以提升中文语言生成的多样性和通用性。

基于医学知识注入提示的少样本ICD编码方法和系统-202310517095.3
发明人：刘军平;杨士臣;朱强;彭涛;胡新荣 -专利权人：武汉纺织大学
申请日： 2023-05-09 - 公布日： 2023-07-04 - 主分类号： G06F40/12
摘要：本发明涉及一种基于医学知识注入提示的少样本ICD编码方法和系统，该方法能够根据输入的医学文本生成最佳的ICD编码，提高了医学文本和ICD编码之间的匹配准确性。该方法包括以下步骤：S1：对输入的医学文本进行预处理；S2：通过UMLS和ICD本体的医学知识图中的同义词、缩写、层次结构构建数据集，并且使用分层三重态损失对longformer模型进行预训练，将结构化的医学领域知识注入到longformer模型中；S3：利用UMLS为每个ICD编码c生成一个对应的编码描述，并将预处理后的医学文本t、编码描述和固定的文本模板拼接在一起，形成一个新的输入序列，并利用训练好的longformer模型对输入序列进行分类，得出ICD编码的分类结果。

源字符串拼接提取方法、装置、电子设备及存储介质-202310317756.8
发明人：陈裕聪;许林;唐如意 -专利权人：成都赛力斯科技有限公司
申请日： 2023-03-28 - 公布日： 2023-06-23 - 主分类号： G06F40/12
摘要：本申请提供一种源字符串拼接提取方法、装置、电子设备及存储介质。该方法包括：根据预定义的键值对规则，为每种源字符串设置相应的键值对，其中键值对包含源字符串对应的特性键和特性值；将源字符串存储为特性字符串对象，利用源字符串的键值对为特性字符串对象添加标记；利用预设的拼接方法对源字符串执行拼接操作，得到拼接后的结果字符串；在后期处理时，调用预定的枚举属性函数对结果字符串进行遍历，得到标记的键值对或特性值，将键值对或特性值作为回调函数的输入，利用回调函数对键值对或特性值对应的源字符串进行提取并处理。本申请降低内存消耗和性能损耗，降低了操作难度，提高源字符串拼接提取的效率。

一种Excel均值中值解析为主的大学教师试卷分析系统-202110239328.9
发明人：罗冠军;李玉扩;李红;刘向新;李大军 -专利权人：吉林农业大学
申请日： 2021-03-04 - 公布日： 2023-06-23 - 主分类号： G06F40/12
摘要：本发明公开了一种Excel均值中值解析为主的大学教师试卷分析系统，可进行教务系统成绩生成之后的试卷分析，减轻教师工作量，提升工作效率和教学能力。教务系统生成的综合成绩文本格式文件，经软件提取卷面成绩后，按照均值板块、偏移板块、中极值板块，辅以峰偏板块分析，利用均值与去首尾均值、期望值之间差异约束参数、全距与中值差异约束参数，辅以峰度、偏度约束参数和备注，进行约束条件卷面解析，合并输出结果，附带试卷整体评价和答题进度勾选项。该系统具有学科普适性强、简便易行、通俗易懂、实用性强、兼容性与开放性和界面良好的特点。

字符串长度计算方法及装置、计算机存储介质-202010152674.9
发明人：张宇 -专利权人：广州方硅信息技术有限公司
申请日： 2020-03-06 - 公布日： 2023-06-20 - 主分类号： G06F40/12
摘要：本申请公开了一种字符串长度计算方法及装置、计算机存储介质，属于电子技术领域。所述方法包括：获取目标字符串对应的所有码点。对该所有码点进行划分，得到一个或多个目标码点集合。将目标码点集合的数量确定为目标字符串的长度。由于每个目标码点集合对应目标字符串中的一个字符，该字符可以是绘文字也可以是非绘文字，将目标码点集合的数量确定为目标字符串的长度，也即是，将绘文字和非绘文字的长度均确定为1，进而能够提高字符显示的准确性。

用于输出信息的方法和装置-201910552619.6
发明人：蒋帅;陈思姣;梁海金;罗雨;卞东海 -专利权人：北京百度网讯科技有限公司
申请日： 2019-06-25 - 公布日： 2023-06-16 - 主分类号： G06F40/12
摘要：本公开的实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括：获取待转换的音频信息；将音频信息转换成文本信息；将文本信息进行切词，得到词序列；对于词序列中的词，通过预先训练的词连接概率模型得到的词连接概率表查询该词和与该词的下一个词之间连接概率和该词与各类标点的连接概率，以及基于查询到的连接概率确定该词的连接目标；将词序列中各词与相应的连接目标连接起来生成带标点的文章进行输出。该实施方式能够将音频自动转成带标点的文章。

软件模型中族类型名称的简化系统及其简化方法-202310150748.9
发明人：张学;洪恩钦;宋强;余少乐;王碗;别军浩;陈大权;孙林;陈新喜;鄢全科;沈铮琦;牛百川;任建钊;孙统宝 -专利权人：中国建筑第八工程局有限公司
申请日： 2023-02-22 - 公布日： 2023-06-13 - 主分类号： G06F40/12
摘要：本发明公开了一种软件模型中族类型名称的简化系统及其简化方法，简化系统包括：用于获取软件模型中原始族类型名称的获取单元；根据原始族类型名称的命名规则以相同的节点字符为节点来分割原始族类型名称的分割单元，所述分割单元将原始族类型名称分割为至少两个元素，至少两个元素中包括一个特性元素；用于提取特性元素的提取单元；用于将原始族类型名称替换为特性元素并形成新的族类型名称的重命名单元；用于将所述原始族实例导入新的族类型名称的写入单元，所述原始族实例与新的族类型名称相互对应重新关联；用于将重复的新的族类型名称批量合并的合并单元，所述合并单元与所述重命名单元数据连接，通过本申请优化了Revit模型的命名系统。

文本处理、同形异码字确定方法、装置和设备-202310199456.4
发明人：马诗涵;黄文亢;石秋慧;王洪彬 -专利权人：支付宝（杭州）信息技术有限公司
申请日： 2023-02-24 - 公布日： 2023-06-06 - 主分类号： G06F40/12
摘要：本说明书实施例公开了一种文本处理、同形异码字确定方法、装置和设备，所述文本处理方法可在获取待处理文本后，针对所述待处理文本中的第一字符，确定目标字符集中是否包含所述第一字符，其中，所述第一字符为所述待处理文本中的任一字符，所述目标字符集中的字符能够被后续文本处理任务正确处理；在所述目标字符集中不包含所述第一字符的情况下，确定所述目标字符集中是否存在第二字符，其中，所述第二字符为所述第一字符在所述目标字符集中的同形异码字；在所述目标字符集中存在所述第二字符的情况下，将所述待处理文本中的所述第一字符替换为所述第二字符。

一种基于POI的Word文档样式检测方法及装置-202211681128.X
发明人：林吉豪 -专利权人：天翼云科技有限公司
申请日： 2022-12-27 - 公布日： 2023-05-26 - 主分类号： G06F40/12
摘要：本发明公开了一种基于POI的Word文档样式检测方法及装置，涉及计算机网络视频传输技术领域。该基于POI的Word文档样式检测方法，包括以下步骤：第一步：获取Word文档的样式，输出样式结果；第二步：对Word文档进行整体检测，在文档中标记检测结果。本发明通过采用POI对docx格式的Word文档进行解析、划分段落，使文档样式检测更加简单方便有效，通过设置Word文档样式的特定继承流程，达到了能够获取Word文档中准确的样式，通过设置模块类型并设置模块对应的分析算法，达到了对整体文档进行良好的划分，极大的简化了分析流程的效果，解决了现有的文档样式分析流程复杂的问题。

字体类型检测方法、装置、电子设备及存储介质-201910361924.7
发明人：蒋演;吕庆春;彭飞 -专利权人：五八有限公司
申请日： 2019-04-30 - 公布日： 2023-05-16 - 主分类号： G06F40/12
摘要：本发明公开了一种字体类型检测方法、装置、电子设备及存储介质，能够对待测代码进行处理，分析出其中的字体调用语句，字体调用语句中包括了待测字体名称，再判断出待测字体名称是否存在于字体白名单中，如果存在，则待测字体名称对应的待测字体即为检测出的目标字体。本发明的技术方案可在编译待测代码的过程中自动地检测出目标字体，避免设计人员人工对目标字体进行判断，使目标字体检测的结果更加准确。

一种基于关键字与框线特征的期刊文献表格高效提取方法-202211484163.2
发明人：邓建新;刘港;吴秀松;梁嘉威;唐伟博;贺德强;戴博林;农张华;黎业富 -专利权人：广西大学
申请日： 2022-11-24 - 公布日： 2023-05-05 - 主分类号： G06F40/12
摘要：本发明提供一种基于关键字与框线特征的期刊文献表格高效提取方法，属于PDF文件信息提取领域，方法包括根据期刊表格框线与字符特点构建表格数据结构，表格数据结构由关键字与表格框线两部分组成，分别构建关键字清洗规则与表格框线清洗规则，利用关键字计算期刊表格区域的左上角坐标，利用表格框线计算期刊表格区域的右下角坐标，精确定位表格区域，最后输出表格数据。该方法特别针对期刊文献中的少框线表格设计，完全适用于中英文文献，可实现表格数据提取的全自动化，保证表格数据逻辑关系的准确性。通过新增关键字进一步实现相关领域表格的筛选，具有广泛的适用性。

一种基于参数类型的表达式处理方法、设备及存储介质-202310021452.7
发明人：赵志武;甘云锋;江敏;高雁冰 -专利权人：杭州数澜科技有限公司
申请日： 2023-01-07 - 公布日： 2023-05-05 - 主分类号： G06F40/12
摘要：本发明涉及信息技术处理技术领域，提供一种基于参数类型的表达式处理方法、设备及存储介质，本发明的表达式解析与表达式计算分步进行，可以自由调整计算范围和计算容忍度，可实现缺失参数值的表达式不参与计算等场景的业务；本发明可支持多种场景，可以同时实现表达式计算和参数替换，不需要在该业务场景下选择多种不同实现或拆分多步骤进行。本发明具有良好的拓展性，基于参数类型的拓展设计，可以自由定制丰富更多支持的参数类型，从而提升技术实现的便利性，降低业务实现技术成本。

文本归一化处理方法及装置-202111239564.7
发明人：孙莉 -专利权人：中移（苏州）软件技术有限公司;中国移动通信集团有限公司
申请日： 2021-10-25 - 公布日： 2023-05-05 - 主分类号： G06F40/12
摘要：本发明公开了一种文本归一化处理方法及装置，方法包括：对获取的待处理的文本进行分段处理，得到多个文本段，并确定待转写的文本段；将待转写的文本段进行聚类转化处理，得到对应的字符集组合类别；根据字符集组合类别，查找预设文本归一化规则，从中确定匹配的至少一个转写规则；预设文本归一化规则包括字符集组合类别及转写规则；根据至少一个转写规则，将待转写的文本段转化为指定字符，得到归一化后的文本。通过字符集组合类别与转写规则进行匹配，可以简化转写规则的复杂度，也提高匹配精准度，方便根据转写规则将待转写的文本段转化为指定字符，得到归一化后的文本，无需对文本通篇匹配，转写更简便。整个过程可读性高，方便扩展和构建。

逻辑表达式的结构比对方法、装置、设备及存储介质-202211711444.7
发明人：董儒汲;郭焕阳;彭锃;丁波;刘超;纪传俊;纪达麒;陈运文 -专利权人：达而观智能（深圳）有限公司
申请日： 2022-12-29 - 公布日： 2023-05-02 - 主分类号： G06F40/12
摘要：本发明公开了一种逻辑表达式的结构比对方法、装置、设备及存储介质。该方法包括：对第一逻辑表达式和第二逻辑表达式分别进行解析，生成与第一逻辑表达式和第二逻辑表达式分别匹配的基础元素组；如果每个基础元素组中包括的基础元素均相同，则生成与第一逻辑表达式和第二逻辑表达式分别匹配的简化多叉树；根据各简化多叉树的层级布局关系和树节点总数量，生成各简化多叉树中各树节点的节点编码；根据各简化多叉树中不同树节点间的逻辑关系和各树节点的节点编码，生成各简化多叉树的逻辑值，并根据各逻辑值生成对第一逻辑表达式和第二逻辑表达式的比对结果。通过采用上述技术方案，能够代替传统的人工比对方式，对复杂的逻辑表达式进行快速比对。

数据监控方法、设备及计算机存储介质-201811226988.8
发明人：钱立化;周明莉 -专利权人：众安在线财产保险股份有限公司
申请日： 2018-10-22 - 公布日： 2023-04-28 - 主分类号： G06F40/12
摘要：本公开内容公开了数据监控方法、设备及计算机存储介质。数据监控方法包括：在多个第一类规则集合中每一个第一类规则集合中判断是否存在至少一个规则共性；在存在至少一个规则共性的情况下，将第一类规则集合划分出相应的第二类规则集合；利用规则共性生成与第二类规则集合相对应的验证规则模型；基于第二类规则集合与需要符合第二类规则集合的字段、标准数据表的关联性，识别出要符合第二类规则集合的标准数据表中的字段；将字段结合到验证规则模型中以生成与字段相对应的验证脚本；在字段所属的标准数据表中通过验证脚本来验证与字段相对应的所有数据单元；以及当存在不满足验证脚本的数据单元时，生成与数据单元相关的报错信息。

文本处理方法及装置-201811585329.3
发明人：刘恒友;李辰;包祖贻;徐光伟;李林琳;司罗 -专利权人：阿里巴巴集团控股有限公司
申请日： 2018-12-24 - 公布日： 2023-04-28 - 主分类号： G06F40/12
摘要：本申请实施例提供了一种文本处理方法及装置。由于预设专有词汇识别模型是基于条件随机场模型训练得到的，如此预设专有词汇识别模型可以根据目标文本的上下文的语义环境将目标文本中的、虽然不属于预设专有词汇库但事实上却无需纠正的词汇确定为专有词汇，由于正确的词汇是无需纠正的，因此可以将确定出的目标文本中的专有词汇确定为正确的词汇。相比于现有技术只能确定出文本中的位于专有词汇库中的词汇是否为正确的词汇，本申请中还能够确定出文本中的不位于专有词汇库中的词汇是否为正确的词汇，从而相比于现有技术，对于同一文本，本申请可以确定出更多的正确的词汇。

一种项目标准测试文档自动化生成方法及装置-202310047877.5
发明人：虞砺琨;陈华南;于倩;黄晨;王小丽 -专利权人：北京轩宇信息技术有限公司
申请日： 2023-01-17 - 公布日： 2023-04-25 - 主分类号： G06F40/12
摘要：本发明公开了一种项目标准测试文档自动化生成方法及装置，方法包括步骤一，建立数据模型；步骤二，创建文档模板；步骤三，获取待填充数据；步骤四，匹配求解算法；步骤五，计算填充数据；步骤六，输出存储文档；装置包括信息获取模块、数据获取模块、数据处理模块和文档生成模块，所述XML中配置语法为自然语言和标识符语言，在配置文件中进行业务规则输入，本发明相较于现有的文档自动化生成方法，可实现项目文档的自动生成以及关联性分析，一键生成文档，且文档标准规范，同时支持不同类型的图表生成，具有更高的灵活度，进而解决了相关技术中手动生成效率低、以及现有自动生成方式定制化、内容不全的问题，提升了工作效率。

一种数据处理方法、装置、设备及存储介质-202310102482.0
发明人：罗冲 -专利权人：深圳前海微众银行股份有限公司
申请日： 2023-01-28 - 公布日： 2023-04-18 - 主分类号： G06F40/12
摘要：本申请公开了一种数据处理方法、装置、设备及存储介质，包括：基于目标符号对待处理文本进行切割，得到多个字符串；所述待处理文本包括N个字段与N个字段值，所述N大于等于1；在所述多个字符串中，识别出所述待处理文本包括的所述N个字段；确定所述待处理文本的目标文本结构；所述目标文本结构用于表征所述待处理文本中所述N个字段与所述N个字段值之间的位置关系；基于所述目标文本结构与所述待处理文本，确定所述N字段中每个所述字段的字段值；基于所述N个字段中每个所述字段的字段值对填单系统中每个所述字段对应的输入框进行填充。本申请的填单方案具有通用性强，应用范围广泛的特点。

一种日志处理方法和装置-201710826895.8
发明人：沈金通 -专利权人：北京国双科技有限公司
申请日： 2017-09-14 - 公布日： 2023-04-18 - 主分类号： G06F40/12
摘要：本发明公开了一种日志处理方法和装置，方法包括：读取日志记录文件中的第N+1行日志；判断所述第N+1行日志与第N行日志是否属于同一条日志；若是，将所述第N+1行日志写入到缓存区中所述第N行日志的结尾处；其中，所述日志记录文件中所记录的所述第N+1行日志与所述第N行日志相邻且两行之间具有所述目标标识符；所述N为正整数；因此，本发明能够顺序的读取日志记录文件中的每一行，并去掉同一条日志中的回车符，相对于现有技术中需要编写复杂的正则表达式来全文匹配日志中的回车符而言，提高了处理效率。

企业软件操作说明文档生成方法及装置、介质、设备-202211614824.9
发明人：纪鹏 -专利权人：浪潮通用软件有限公司
申请日： 2022-12-15 - 公布日： 2023-04-07 - 主分类号： G06F40/12
摘要：本发明提供一种企业软件操作说明文档生成方法及装置、介质、设备，方法包括：确定参数；其中，参数的取值依赖于企业软件运行实例；确定变量和变量表达式；其中，变量表达式由至少一个所述参数组成；确定操作说明文档的文档元素与至少一个所述变量的关联关系；获取在企业软件第一运行实例下的每个参数的取值，形成第一参数值组合；根据第一参数值组合，解析每个变量表达式，形成第一变量值组合；根据第一变量值组合以及所述文档元素与变量之间的关联关系，生成企业软件第一运行实例对应的操作说明文档。本发明可以减轻撰写人员繁重的撰写工作量。

语音机器人YAML文件的可视化生成方法、装置、终端及介质-202211378537.2
发明人：金培沛;章微微 -专利权人：上海湃舵智能科技有限公司
申请日： 2022-11-04 - 公布日： 2023-03-21 - 主分类号： G06F40/12
摘要：本申请提供语音机器人YAML文件的可视化生成方法、装置、终端及介质，本发明通过多模态人机交互的文件生成模块，通过导入机器人基础资料、录音资料、录音文本等信息，自动生成YAML文件，文件生成效率高且由于全自动完成故出错率低，不用再依赖于手动编写YAML文件，解决了YAML文件编写门槛高，编写复杂且容易出错的问题。

基于RPA的网页内嵌文档的处理方法及装置-202211179159.5
发明人：曹艺莹;郭孟扬;郭旗;李春霞 -专利权人：中国工商银行股份有限公司
申请日： 2022-09-27 - 公布日： 2023-02-03 - 主分类号： G06F40/12
摘要：本发明可用于机器人流程自动化技术在金融方面应用的技术领域，本发明提供了一种基于RPA的网页内嵌文档的处理方法及装置，对应的方法包括：获取内嵌有文档的网页表单数据；解析所述网页表单数据，以生成具有Json数组格式的网页表单数据；根据所述具有Json数组格式的网页表单数据处理所述网页表单数据的内嵌文档。本发明所提供的基于RPA的网页内嵌文档的处理方法及装置，通过运用JavaScript技术弥补了RPA机器人在网页内嵌文档自动化填写方面的不足，将业务人员从单一重复的复制、粘贴、在线文档编辑工作中解放出来，不仅减轻了重复劳动工作量，还提高了业务处理效率和数据录入的准确性。

一种标准文献格式审查方法、系统、设备及存储介质-202211320952.2
发明人：喇元;黄军凯;林正平;陶秀杰 -专利权人：贵州电网有限责任公司;南方电网科学研究院有限责任公司
申请日： 2022-10-26 - 公布日： 2023-02-03 - 主分类号： G06F40/12
摘要：本发明公开了一种标准文献格式审查方法，包括获取预设数据库中的历史文献，提取所述历史文献中的多维格式特征；根据所述多维格式特征，生成文献审查模型；获取目标文献，将目标文献传输至所述文献审查模型进行审查，并生成审查结果。本发明利用矩阵的形式来进行后续的计算和控制标注提高系统的计算效率，同时对于文献来说还可以准确并且快速的对文献中的任一部分进行具体定位；利用颜色显示的形式作为审查结果，便于用户的观察，更加符合人性化，辅助提高工作人员的工作效率；实现对文献格式的快速审查，提高用户的工作效率，减少时间成本，提高检测质量。

一种大批量PDF文件合并的方法及系统-202110419112.0
发明人：梁俊义 -专利权人：福建福昕软件开发股份有限公司
申请日： 2021-04-19 - 公布日： 2023-01-24 - 主分类号： G06F40/12
摘要：本发明公开一种大批量PDF文件合并的方法及系统，其中方法包括：输出目标PDF文件的头部信息，输出catalog字典信息，生成PDF页面对象的对象编号并记录；依序解析待合并PDF文件，获取所有间接对象的对象编号和偏移量以及catalog字典信息；依序从catalog字典信息中解析对应待合并PDF文件的页面对象字典信息，并依序读取每个页面对象的对象编号信息；调用全局的对象编号生成器生成新的对象编号，并将原来的对象编号信息和新的对象编号的对应关系记录到映射中；调用PDF间接对象的输出类，将待合并PDF文件的页面对象输出到目标PDF文件的页面对象中，并记录其在目标PDF文件中的开始位置和长度；检查是否所有待合并PDF文件都已经完成合并。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多源Markdown地质资料文本格式规范化方法及系统在审

专利文献下载