[发明专利]面向长文本的主题检测方法在审

专利信息
申请号: 201911008635.5 申请日: 2019-10-22
公开(公告)号: CN110795533A 公开(公告)日: 2020-02-14
发明(设计)人: 王帅 申请(专利权)人: 王帅
主分类号: G06F16/33 分类号: G06F16/33;G06F16/953
代理公司: 暂无信息 代理人: 暂无信息
地址: 150080 黑龙江省*** 国省代码: 黑龙;23
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种面向长文本的主题检测方法,包括以下步骤:1)对长文本进行结构化处理和文本数据抽象,计算Word2vec&TF‑IDF词向量;进行LDA建模,构成文本‑主题分布,利用Skip‑Gram模型来训练语料库,计算其特征向量,在此基础上计算长文本数据的词向量与特征向量的余弦距离进行加权叠加,得出文本相似度。2)以舆情发生的时间先后顺序对长文本进行排序,划分时间窗口对其进行分块,对最初的数据块采用Single‑Pass进行聚类分析,再通过HAC进行话题合并,得出最终结果。该方法通过LDA提取文本特征词隐含的主题,Word2vec映射特征词向量,再将二者进行加权融合,引入时间窗口和凝聚式层次聚类,通过Single‑Pass&HAC对长文本主题进行了完整的提取,输出结果准确度高。
搜索关键词: 长文本 词向量 时间窗口 特征向量 结构化处理 文本相似度 训练语料库 层次聚类 加权叠加 加权融合 聚类分析 输出结果 文本数据 文本特征 映射特征 余弦距离 主题分布 主题检测 最终结果 准确度 凝聚式 数据块 分块 建模 隐含 排序 文本 抽象 合并 引入 话题
【主权项】:
1.一种面向长文本的主题检测方法,其特征在于包括如下步骤:/n1)建立VSM模型,用Q={q
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王帅,未经王帅许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911008635.5/,转载请声明来源钻瓜专利网。

同类专利
  • 一种语音信息的处理方法、装置、智能终端以及存储介质-201910994726.4
  • 胡广绪;宋德超;贾巨涛;吴伟;赵鹏辉 - 珠海格力电器股份有限公司;珠海联云科技有限公司
  • 2019-10-18 - 2020-02-14 - G06F16/33
  • 本申请公开了一种语音信息的处理方法、装置、智能终端以及存储介质,涉及机器学习技术领域,该方法包括:将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。通过该方法可以解决相关技术中存在的当用户获取数据时,往往会出现多个返回结果,出现“一词多义”、“一义多词”现象,从而不能真正理解用户所提出的问题,无法做到精确识别理解用户意图的问题。
  • 面向长文本的主题检测方法-201911008635.5
  • 王帅 - 王帅
  • 2019-10-22 - 2020-02-14 - G06F16/33
  • 本发明公开一种面向长文本的主题检测方法,包括以下步骤:1)对长文本进行结构化处理和文本数据抽象,计算Word2vec&TF‑IDF词向量;进行LDA建模,构成文本‑主题分布,利用Skip‑Gram模型来训练语料库,计算其特征向量,在此基础上计算长文本数据的词向量与特征向量的余弦距离进行加权叠加,得出文本相似度。2)以舆情发生的时间先后顺序对长文本进行排序,划分时间窗口对其进行分块,对最初的数据块采用Single‑Pass进行聚类分析,再通过HAC进行话题合并,得出最终结果。该方法通过LDA提取文本特征词隐含的主题,Word2vec映射特征词向量,再将二者进行加权融合,引入时间窗口和凝聚式层次聚类,通过Single‑Pass&HAC对长文本主题进行了完整的提取,输出结果准确度高。
  • 信息搜索方法及移动终端-201911032573.1
  • 郝少廷 - 维沃移动通信有限公司
  • 2019-10-28 - 2020-02-14 - G06F16/33
  • 本发明提供一种信息搜索方法及移动终端,该方法包括:接收用户输入的搜索词;基于搜索词,从预设的备选词词库中筛选出至少一个备选搜索词;接收用户从至少一个备选搜索词中选取的目标备选搜索词;基于搜索词与目标备选搜索词搜索对应的信息记录。本发明实施例的技术方案,能够减少由于用户输入的搜索词不精确导致的搜索失败,从而提高信息搜索的效率。
  • 一种深度可分离卷积残差块的阅读理解方法-201911033469.4
  • 蔡晓东;郑淑婷;侯珍珍;田文靖 - 桂林电子科技大学
  • 2019-10-28 - 2020-02-14 - G06F16/33
  • 本发明公开了一种深度可分离卷积残差块的阅读理解系统及方法,涉及自然语言处理技术领域,技术方案为,包括以下步骤:数据预处理,对数据进行词向量化表示,转化为网络能够识别的数据信息;提取上下文特征信息,采用卷积残差块对输入数据进行编码,获取输入文本上下文的语义信息;提取交互特征信息,采用三线性相似函数获取文本段落和问题间的语义交互信息;推测并输出答案,采用卷积残差快对交互信息进行编码,并输出预测。相对现有技术,本发明能够在确保答案准确性的同时,显著提升模型的训练和推理速率。
  • 短文本匹配方法、装置、电子设备和存储介质-201911039212.X
  • 王千;梁新敏;陈曦 - 秒针信息技术有限公司
  • 2019-10-29 - 2020-02-14 - G06F16/33
  • 本申请实施例提供的短文本匹配方法、装置、电子设备和存储介质,该方法包括:根据词向量模型获得提问文本向量及预设答案文本向量,并计算词向量的隐含层状态,从而关联提问文本及预设答案文本的上下文。基于提问文本的词向量的隐含层状态及预设答案文本的词向量的隐含层状态计算用于表征提问文本与预设答案文本的相似性和差异性的第一关联矩阵及第二关联矩阵。通过提问文本与预设答案文本的相似性和差异性计算其关联度,并基于关联度判断提问文本与预设答案文本是否匹配,避免了采用词袋模型造成的上下文关联关系丢失的问题,准确率较高。同时也解决了采用正则表达式需要不断更新迭代的问题,可行性高,有利于提升电商领域的运营效率。
  • 语音交互方法及装置-201510995698.X
  • 刘晓阳 - TCL集团股份有限公司
  • 2015-12-24 - 2020-02-14 - G06F16/33
  • 本发明适用于语音交互领域,提供了一种语音交互方法及装置。所述方法包括:接收语音数据;将所述语音数据识别为语义文本;将所述语义文本与生成的历史语音搜索记录进行相似度匹配;将相似度超过指定阈值的历史语音搜索记录作为基础数据库;对所述基础数据库进行筛选处理后,确定至少一待匹配文本;将所述语义文本与确定的所述至少一待匹配文本匹配;根据匹配结果执行对应的操作。本发明实施例能够提高语音交互的准确率及成功率。
  • 查询目标匹配方法及装置-201610742965.7
  • 邹敏;魏强;齐志兵;尹玉宗;姚键;潘柏宇;王冀 - 合一网络技术(北京)有限公司
  • 2016-08-26 - 2020-02-14 - G06F16/33
  • 本发明涉及一种查询目标匹配方法及装置,包括:获取针对相同查询目标的关联查询词;对关联查询词进行分词操作,以获得词;计算各词的词向量;根据所述词向量,确定当前查询词中各词的词向量,以及与待匹配的查询目标相对应的文本中包含的词的词向量;根据当前查询词中各词的词向量以及与待匹配的查询目标相对应的文本中包含的词的词向量,确定当前查询词与文本的语义相似度;根据所确定的语义相似度,从待匹配的查询目标中确定与当前查询词相匹配的查询目标。本发明能够更为准确地将与用户输入的查询词相匹配的查询目标推荐给用户,以提高用户的查询效率。
  • 一种搜索方法及装置-201710312657.5
  • 周忠杰 - 广东艾檬电子科技有限公司
  • 2017-05-05 - 2020-02-14 - G06F16/33
  • 本发明适用于信息处理技术领域,提供了一种搜索方法及装置,包括:获取待搜索题目的文本信息;对所述文本信息进行分词处理,并获取经分词处理后的全部分词词语;根据各个分词词语的字数,设置每个分词词语对应的字数权重;基于所述分词词语的字数权重,将分词词语与题库中的题目进行匹配,并基于匹配结果推送搜索结果。通过上述方法能够提高题目搜索的准确率。
  • 基于养老机器人的信息搜索系统-201710516057.0
  • 潘晓明;彭罗 - 重庆柚瓣家科技有限公司
  • 2017-06-29 - 2020-02-14 - G06F16/33
  • 本发明涉及机器人通信系统,提供了一种基于养老机器人的信息搜索系统,包括用于用户提问的用户终端和若干回答用的养老机器人;用户终端用于发送搜索信息;养老机器人,包括转换单元,用于接收搜索信息并转换成语音信息后输出;播报单元,用于接收语音信息,可进行播报;情景判断单元,用于对老人的状态进行检测,当检测到老人处于休闲状态时,向播报单元输出放送信息,播报单元则进行播报;当检测到老人处于忙碌状态的时候,则不输出信息;采集单元,用于采集老人的声音,然后生成反馈信息并传回到用户终端和记录单元;记录单元,用于接收反馈信息并进行记录;引导单元,用于自主生成搜索信息的语音信息并发送到播报单元;主电源,用于给上述的各单元供电。
  • 一种解码网络中非关键词模型的构建方法和装置-201810770478.0
  • 唐文琦;姚光超 - 北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司
  • 2018-07-13 - 2020-02-11 - G06F16/33
  • 本申请实施例公开了一种解码网络中非关键词模型的构建方法,所述方法包括:获取待筛选的语料集合;确定所述语料集合中所包括字符对应的发音元素的出现率;将出现率满足预设阈值的发音元素构成非关键词集合;根据所述非关键词集合构建解码网络中的非关键词模型。可见,本申请中的非关键词集合中的发音元素属于应用于关键词检索中的高质量发音元素,通过该非关键词集合构建出的非关键词模型不仅容量较小,能够缓解设备的本地存储压力,而且作为非关键词模型更容易命中用户语音中非关键词对应的语音,起到了提高检索出关键词的准确性和成功率的作用。
  • 一种文本匹配方法和装置、存储介质-201910851165.2
  • 董霖;吕繁荣;俞锋锋 - 杭州云深科技有限公司
  • 2019-09-10 - 2020-02-11 - G06F16/33
  • 本发明实施例公开了一种文本匹配方法和装置、存储介质,其中,所述方法包括:获取待检测文本,所述待检测文本为包含有至少两个第一分词的第一分词组;将所述第一分词组与语料库中的文本进行分词匹配,并从语料库中选取出与所述第一分词组的匹配程度满足预设规则的至少一个疑似目标文本;控制滑动窗口按照确定出的滑动步长并通过在所述疑似目标文本中滑动的方式,从所述疑似目标文本中截取出至少两个第二分词以形成第二分词组;将所述第一分词组与所述第二分词组进行匹配,至少基于匹配结果确定所述疑似目标文本是否为与所述待检测文本相匹配的目标文本。如此,为准确、高效地判断出待检测文本是否为抄袭文本奠定了基础。
  • 一种问答对生成的方法与装置-201910880193.7
  • 王励;陈咨尧;钟黎;刘黎春 - 腾讯科技(深圳)有限公司
  • 2019-09-16 - 2020-02-11 - G06F16/33
  • 本申请实施例提供了一种问答对生成的方法,能够提高问答对的问题和答案之间的匹配度。其中,该方法在获取待解析文本后,根据待解析文本生成候选问答对,其中,待解析文本包括n层信息,n大于等于2,候选问答对是基于n层信息中的相邻两层信息生成的,候选问答对的问题是基于相邻两层信息中的上层信息生成的,候选问答对的答案是基于相邻两层信息中的下层信息生成的,下层信息从属于上层信息。然后通过目标分类模型获取候选问答对所对应的相关性分值,最后根据候选问答对所对应的相关性分值从候选问答对中确定目标问答对。
  • 文本识别模型相似度训练方法、系统、识别方法及终端-201910901703.4
  • 詹威;肖龙源;蔡振华;李稀敏;刘晓葳;王静 - 厦门快商通科技股份有限公司
  • 2019-09-23 - 2020-02-11 - G06F16/33
  • 本发明适用于文本识别技术领域,提供了一种文本识别模型相似度训练方法、系统、识别方法及终端,该方法包括:获取样本数据,分别对样本数据内的样本语句进行相似度计算,以获取多组相似语句组合;判断相似语句组合内的相似语句之间是否满足语义条件,根据判断结果对相似语句进行样本标记;根据样本标记的标记结果以构建训练数据集,根据训练数据集对文本识别模型进行模型训练。本发明通过对相似语句组合内的相似语句进行是否满足语义条件的判断的设计,以对应进行正样本标记或负样本标记,以达到将训练数据集中组词相同但语义不同的相似语句进行负标记的效果,进而防止了后续文本识别模型由于该组词相同但语义不同的相似语句所导致的答非所问。
  • 智能语音终端及其智能语音系统和软件-201910974456.0
  • 张王 - 张王
  • 2019-10-14 - 2020-02-11 - G06F16/33
  • 本发明公开了一种智能语音终端及其智能语音系统和软件,包括数据库模块,数据库模块中包括精准到商品名的产品词条,以及产品对应的垃圾分类信息词条;包括语音接收模块,语音接收模块用于接收用户发出的语音信息;包括语音识别模块,语音识别模块用于对用户声波进行采集,且集中采集商品名、垃圾分类关键词;包括智能搜索模块,对采集到的关键词在数据库模块中搜索对应的商品名的产品词条,并根据其关联的垃圾分类信息词条将信息传递给语音播放模块播放给用户完成垃圾分类。本发明可以精准到商品词条的垃圾分类信息,让用户在分类的情况下更加简洁精准。
  • 基于知识图谱的语音辅助方法及装置-201911001544.9
  • 唐希元;姜瑾 - 深圳众赢维融科技有限公司
  • 2019-10-21 - 2020-02-11 - G06F16/33
  • 本公开实施例公开了一种基于知识图谱的语音辅助方法及装置。其中,该方法包括:根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;接收所述用户语音输入的问题并进行识别;基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
  • 新兴主题的探测方法、装置、计算机设备及存储介质-201911018881.9
  • 徐硕;郝丽媛 - 北京工业大学
  • 2019-10-24 - 2020-02-11 - G06F16/33
  • 本发明实施例公开了一种新兴主题的探测方法、装置、计算机设备及存储介质,包括下述步骤:获取目标领域的数据集,其中,所述数据集包括目标领域的文献信息以及每篇文献的引文信息;根据预设的主题抽取规则在所述数据集中抽取研究主题;计算所述研究主题的新兴指标;根据所述新兴指标在所述研究主题中确定所述目标领域的新兴主题。通过这种方法不仅可以识别某一领域的新兴研究主题,而且可以预测该领域未来的新兴研究主题。运用了结合引文关系网络分析法和文本挖掘法的混合方法,发挥了多种机器学习模型的优势,结合这两种方法来探测新兴研究主题,克服了使用任意单一方法的缺陷,可以获得易于解释的新兴研究主题结果。
  • 一种数据处理方法、装置及电子设备-201911045264.8
  • 仇鹏涛;赵国光;叶偲 - 联想(北京)有限公司
  • 2019-10-30 - 2020-02-11 - G06F16/33
  • 本申请公开了一种数据处理方法、装置及电子设备,方法包括:获得用户的第一输入数据,所述第一输入数据在第一区域显示;基于所述第一输入数据,在区别于第一区域的第二区域输出第一内容;其中,所述第一内容中包括多个子内容,所述子内容基于与所述第一输入数据相关联的字段生成,且,所述第一内容用于提示用户在所述子内容中对应的多个目标位置上输入相应的内容,所述目标位置与所述子内容对应的字段相关。可见,本申请中在区别于用户所输入的输入数据的显示区域上,一次输出包含多个子内容的第一内容,从而提示用户可以在每个子内容对应的目标位置上输入相应的内容,进而节省了分多次输出子内容的耗时,由此达到提高信息获取效率的目的。
  • 一种基于匹配度检索英文文本的方法-201710427632.X
  • 刘曲;杨天地;马丽娣 - 锦州医科大学
  • 2017-06-08 - 2020-02-11 - G06F16/33
  • 本发明公开了一种基于匹配度检索英文文本的方法,包括:步骤一、在服务器预先存储检索信息,每篇英文文献关联一个检索单位,对于任意一个检索单位均包括ID、英文文献录入时间和至少一个检索条,所述检索条为由所述检索单位关联的英文文献的摘要中的至少一个名词和实意动词组成,并且对全部检索条进行预设权重;步骤二、输入检索英文,对所述检索英文拆分名词与实意动词,并且将所述名词与所述实意动词扩展成为检索语句;步骤三、对所述检索语句进行相似度评价得到检索权重,并将所述检索权重与所述预设权重分别进行匹配,按照匹配度进行排序得到检索结果列表。
  • 会计凭证差异标记系统及方法-201910824374.8
  • 何豫新 - 北京东软望海科技有限公司
  • 2019-09-02 - 2020-02-07 - G06F16/33
  • 本申请公开了会计凭证差异标记系统及方法,其中所述系统包括:差异标记确定模块,用于确定会计凭证是否需要标记差异;差异金额计算模块,用于响应于确定会计凭证需要标记差异,计算财务会计收支与预算会计收支的差异金额;差异大类确定模块,用于根据预设差异大类标注规则确定对应的差异大类及相应的标注金额;差异明细项确定模块,用于根据预设差异明细项标注规则确定对应的差异明细项及相应的标注金额;差异标记表生成模块,用于根据差异金额计算模块、差异大类确定模块及差异明细项确定模块的结果生成差异标记表。本发明使能对会计凭证差异进行自动标记,进而使能自动生成“本年盈余与预算结余的差异情况说明”表,提高会计工作效率。
  • 数据加密查询方法及装置-201910968294.X
  • 杜龙军 - 北京字节跳动网络技术有限公司
  • 2019-10-12 - 2020-02-07 - G06F16/33
  • 本公开提出一种数据加密查询方法及装置,其中,方法包括:获取待加密数据,根据预设的线性加密参数对待加密数据进行加密,生成加密后的目标数据;接收范围查询指令,获取第一字段值和第二字段值,其中,第一字段值和第二字段值用于确定查询范围;根据线性加密参数对第一字段值和第二字段值进行计算,获取映射后的查询参数,根据查询参数与目标数据确定范围查询结果。由此,能够基于加密数据实现范围查找,解决了相关技术中可搜索加密方式无法很好的支持范围查找的问题。
  • 数据分析方法及数据分析装置-201410204300.1
  • 温春龙;陈妍;梁璟彪;骆玘;黄利贤;樊中一;吕虹;刘敏 - 腾讯科技(深圳)有限公司
  • 2014-05-14 - 2020-02-07 - G06F16/33
  • 本发明提供一种数据分析方法及数据分析装置,所述方法包括:根据输入的文本内容建立产品标签库;根据所述文本内容获取口碑词修饰的主语,所述口碑词为是对所述文本内容进行分词处理,以及通过预存的词库对分词处理后达到预设频次的词语进行筛选得到的;将所述主语与所述产品标签库中的标签进行匹配;根据与所述主语相匹配的标签,生成反映所述文本内容中共性问题的结果标签树。上述方法实时全面的收集评论内容,且简化现有的数据分析方式,提高数据分析的准确性。
  • 一种恶意订单地址的判定方法和装置-201610149844.1
  • 王曦晨;钱春江;章平亮;王富祥;杜保才 - 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
  • 2016-03-16 - 2020-02-07 - G06F16/33
  • 本发明提供一种恶意订单地址的判定方法和装置,能够快速判定和查找出恶意订单用户,特别是能快速判定和查找出频繁抢单的恶意订单用户并将其进行拦截,保证了普通用户的利益,地址查询时间短且查询效率高。本发明的恶意订单地址的判定方法包括:接收订单地址,并按照预定层次顺序从地址库中查找出与订单地址相同部分最多的地址作为相似地址;计算相似地址与订单地址的相似度和查找时间差,并获取相似地址的累计查找次数,其中,查找时间差为订单地址的当前查找时间和相似地址的查找时间之差中的最小值;根据相似度、查找时间差和累计查找次数计算订单地址的得分;将得分大于预设的得分阈值的订单地址判定为恶意订单地址。
  • 一种数据处理方法及设备-201710910062.X
  • 顾杜娟;叶晓虎;范敦球 - 北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司
  • 2017-09-29 - 2020-02-07 - G06F16/33
  • 本发明实施例提供一种数据处理方法及设备,用于解决现有技术中各漏洞数据库中漏洞记录无法融合共享的技术问题。该方法包括:获取来自至少两个漏洞数据库的至少两个漏洞记录;其中,漏洞记录用于描述不同机构所对应系统的漏洞的数据内容;对至少两个漏洞记录中每个漏洞记录的属性特征进行义素分析;其中,在不同属性特征的漏洞记录对应于不同的分级类型,分级类型与漏洞记录所表征的数据内容的类型相关;将至少两个漏洞记录中属性特征之间存在的共同义素的漏洞记录与第一分级类型进行关联,并生成包含至少一个第一分级类型的标准漏洞数据库;其中,第一分级类型下的漏洞记录具有至少一个相同的属性特征。
  • 确定输入文本与兴趣点间的相关性的方法和系统-201810734815.0
  • 陈欢;赵骥;宋奇 - 北京嘀嘀无限科技发展有限公司
  • 2018-07-06 - 2020-02-04 - G06F16/33
  • 本发明公开了一种确定输入文本与兴趣点间的相关性的方法和系统。所述方法包括:获取用户的输入文本;通过语义相关性模型确定与所述输入文本相关的兴趣点;和通过所述语义相关性模型确定所述输入文本与所述兴趣点间的语义相关性分数。采用该方法,不仅可以检索到与输入文本在字词上匹配的兴趣点,还可以检索到与输入文本在字词上不匹配但在语义上匹配的兴趣点,从而提高了系统检索与输入文本相关的兴趣点的全面性和准确性。
  • 搜索电子书的方法、装置、设备及计算机可读存储介质-201810789263.3
  • 李祎哲 - 广州阿里巴巴文学信息技术有限公司
  • 2018-07-18 - 2020-02-04 - G06F16/33
  • 本发明提供一种搜索电子书的方法、装置、设备及计算机可读存储介质。方法包括:接收用户选择的目标输入方式,根据所述目标输入方式接收所述用户输入的用于搜索电子书的搜索信息;根据所述目标输入方式确定预处理方法,并根据所述预处理方法对所述搜索信息进行处理;根据处理结果、预设电子书信息确定目标电子书。本发明的方案,根据不同的目标输入方式确定预处理方法,能够更加准确的对用户输入的搜索信息进行处理,得到准确、有用的书籍信息,进而根据提取出的信息确定出的目标电子书更加准确,因此,本发明的方案能够提高用户的搜索效率和准确率,从而提高用户体验。
  • 聊天记录关键词的提取方法、装置、计算机设备及存储介质-201910753715.7
  • 张思亮 - 中国平安财产保险股份有限公司
  • 2019-08-15 - 2020-02-04 - G06F16/33
  • 本发明提供一种聊天记录主题提取方法、装置、计算机设备及存储介质,该方法包括以下步骤:获取多条待提取主题的聊天记录;对所述多条聊天记录进行分词处理;对经过分词处理后的多条聊天记录进行聚类处理,以将所述多条聊天记录分成多个类别;根据所述每个类别下的聊天记录,获取每个类别对应的关键词;根据所述每个类别下聊天记录对应的关键词,得到所述多条聊天记录的主题。本发明在用户查看聊天记录时,可以通过显示聊天主题代替冗长的聊天记录,使显示内容更简洁、直观,提升用户体验。
  • 单据数据核查处理方法、装置、计算机设备和存储介质-201910842557.2
  • 马全才 - 平安医疗健康管理股份有限公司
  • 2019-09-06 - 2020-02-04 - G06F16/33
  • 本申请涉及异常监控的一种单据数据核查处理方法,所述方法包括:获取多个待测单据数据,对多个待测单据数据分配相应的处理线程;将待测单据数据输入已训练的信息提取模型,输出待测产品信息、待测项目信息和决策信息;根据产品应用范围表和项目应用范围表确定对应的产品属性值和项目属性值;将决策信息与产品属性值不匹配的待测产品信息确定为异常产品,与产品属性值不匹配的待测项目信息确定为异常项目;获取待测单据数据的异常产品数值和异常项目数值;若异常产品数值和异常项目数值超过预设阈值,将对应的待测数据标记为异常单据数据,生成相应的异常提示信息并发送至核验终端。采用本方法能够准确有效地识别和核查存在异常的单据数据。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top