[发明专利]一种可随时查看结果的词汇量测试方法及其测试系统、移动测试终端有效

专利信息
申请号: 201710875496.0 申请日: 2017-09-25
公开(公告)号: CN107590129B 公开(公告)日: 2021-07-09
发明(设计)人: 曹译珑;岳校;谭锦钿 申请(专利权)人: 清远墨墨教育科技有限公司
主分类号: G06F40/216 分类号: G06F40/216;G06Q50/20;G09B7/02
代理公司: 广州圣理华知识产权代理有限公司 44302 代理人: 李唐明;顿海舟
地址: 511500 广东省清远*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种可随时查看结果的词汇量测试方法及其测试系统、移动测试终端,先将数据库中的词汇进行排序并分区,从每个区中抽取一个词汇量供测试者测试,根据测试者的测试结果,得出临时词汇量,一轮结束以后在上一轮的测试结果的正负增幅内重新确定测试区域,并将该区间划分成比上一轮多一个的区间,再从每个区中抽取一个词汇量供测试者测试,以此规律继续,直至划分后每个区间的词汇量为40,得出最终的测试结果。本发明的特点在于测试者随时结束测试可随时查看结果,且随着测试词汇的增多准确度越高,方便得出测试者的词汇量。
搜索关键词: 一种 随时 查看 结果 词汇量 测试 方法 及其 系统 移动 终端
【主权项】:
一种可随时查看结果的词汇量测试方法,适于利用计算机设备执行,其特征在于,该方法包括:将计算机数据库中的词汇依次进行排序,词汇的总数量为W0,对各词汇依次标注自然数序号形成数集[1,W0];依次输出词汇样本,同时针对每个样本提供至少包含有1个肯定项的选项集,并至少收集肯定项的选择数据;按以下方式按顺序依次输出词汇样本:1)第1轮样本输出,将数集[1,W0]平均分成S1个区间集,S1≥3,按顺序依次从每个区间集随机抽取1个对应编号的词汇作为样本输出,收集第一轮的肯定项选择数据N1,计算第1轮的词汇量2)第n轮样本输出,n≥2,形成新数集[(1‑k)*Wn‑1,(1+k)*Wn‑1],10%≤k≤50%,将新数集平均分成Sn个区间集,Sn=Sn‑1+1,按顺序依次从每个区间集中随机抽取1个对应编号的词汇作为样本输出,收集第n轮的肯定项选择数据Nn,计算第n轮的词汇量其中Wn‑1为第n‑1轮的词汇量;查看每收集到任一个肯定项数据当前的词汇量时,将当轮未收集到的肯定项数据统计为零。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清远墨墨教育科技有限公司,未经清远墨墨教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710875496.0/,转载请声明来源钻瓜专利网。

同类专利
  • 交易用途的获取方法、装置、电子设备和存储介质-202310701992.X
  • 伏峰;江涛;蔡素贤 - 中国建设银行股份有限公司;建信金融科技有限责任公司
  • 2023-06-13 - 2023-10-27 - G06F40/216
  • 本公开关于一种交易用途的获取方法、装置、电子设备和存储介质,属于计算机技术领域。其中,该方法包括:对资金交易备注说明文本进行分词处理,得到分词;获取分词对应不同交易用途的词频;获取分词在资金交易备注说明文本中的词重要度;根据词频和词重要度计算资金交易备注说明文本属于不同交易用途的概率;将概率最高的交易用途确定为资金交易备注说明文本的目标交易用途。本公开根据资金交易备注说明文本中的各分词对应各交易用途的词频、各分词的词重要度计算不同交易用途的概率,并将概率最高的交易用途确定为目标交易用途,整个过程基于数据处理,不涉及人为主观信息,保证了客观性,使得对资金交易用途的预测准确性高。
  • 一种数据处理方法、装置、设备及存储介质-202210390669.0
  • 张文略;卓兴中;韩秦;余天照 - 腾讯科技(深圳)有限公司
  • 2022-04-14 - 2023-10-27 - G06F40/216
  • 本申请实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取首字符输入串以及目标历史文本数据,生成业务请求;在接收到服务器返回的目标模型候选数据时,获取目标对象输入串,在目标模型候选数据满足模型调频条件时,基于目标对象输入串与目标模型候选数据之间的匹配映射关系,对第一候选文本对应的第一词频评估值进行调整,得到第二词频评估值;获取第二候选文本对应的客户端词频评估值,基于第一候选文本对应的第二词频评估值以及第二候选文本对应的客户端词频评估值,对第一候选文本和第二候选文本进行排序处理,得到候选排序结果。采用本申请实施例,可以提高候选排序结果的准确度。
  • 一种基于统计量与相似性的网络新词发现方法及系统-202110235703.2
  • 陈莉;张爽;李铮 - 西北大学
  • 2021-03-03 - 2023-10-27 - G06F40/216
  • 本发明属于自然语言处理领域,公开了一种基于统计量与相似性的网络新词发现方法及系统,先计算单字词的词频得到初始的单字词集合,并利用改进后的增强互信息和加权左右邻接熵从左向右扩展多字候选词,合并单字词集和多字词集得到候选新词集,然后将候选词作为中心词进行依存句法分析,计算句法结构的相似性值和候选新词所在句子与历史表达的语义相似值,进行过滤得到新词集合。和传统的统计量计算结果相比,本发明选用的方法可以有效过滤部分重复含义的词串,也解决了字词出现次数以及贡献不对称问题,加入相似性判断之后,有效提高了新词发现的准确。
  • 一种基于区块链的自动合成新闻的检测方法及系统-202110035612.4
  • 毛典辉;黄晖煜;张青川;李海生;左敏;蔡强 - 北京工商大学
  • 2021-01-12 - 2023-10-27 - G06F40/216
  • 本发明涉及一种基于区块链的自动合成新闻的检测方法及系统,其方法包括:步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;步骤S2:利用激励机制对新闻样本集进行纠错;步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,并生成近似真实新闻的机器合成新闻样本;步骤S4:计算合成新闻样本和真实新闻样本的比例,当超过阈值,将机器合成新闻样本加入新闻样本集,进行增量训练,得到更新后的新闻分类结果。本发明可以提高样本集的质量,均衡新闻正负样本,防止过度拟合,并使用智能合约来增量训练逻辑回归分类模型,解决逻辑回归分类模型容易过时的问题。
  • 处理数据的方法、装置、设备及存储介质-202110874819.0
  • 唐康 - 湖南提奥医疗科技有限公司
  • 2021-07-30 - 2023-10-27 - G06F40/216
  • 本发明涉及数字医疗领域,本发明提供了一种处理数据的方法、装置、设备及存储介质,其中,方法包括:将业务数据集拆分为训练数据集和多个验证数据集,其中,业务数据集中的数据为处方或者病历;训练得到各个语言处理模型,将各所述语言处理模型按照预设的数量进行组合,得到多个模型组合,根据各个所述模型组合的所述偏差为各个所述模型组合分别设置对应的处理权重,基于所述处理权重分配对应的数据量至各所述模型组合中进行处理。通过不同的验证集验证模型,从而得到多个语言处理模型,将得到的语言处理模型进行组合,通过多个模型组合对数据进行处理,从而实现了通过不同的语言处理模型对数据的处理,可以对数据进行更好分析。
  • 数据集生成方法、装置、电子设备及可读存储介质-202310805385.8
  • 周航成;梁晓东;阮禄;冉猛;赵进;危枫;王晨子 - 中国电信股份有限公司
  • 2023-06-30 - 2023-10-24 - G06F40/216
  • 本发明提供了一种数据集生成方法、装置、电子设备及可读存储介质,通过对没有标签的句子文本的统计,确定出针对句子的第一采样概率,将句子中的字符进行统计,得到针对每个字符的第二采样概率,将无标签句子文本中的字符与拼音的对应关系扩充至拼音字典,使得可以根据第一采样概率从无标签句子文本中对句子采样,得到用于构建有标签数据集的句子,并根据第二采样概率从采样的句子中确定目标字符,将目标字符替换为根据替换概率从新的拼音字典确定的目标替换字符,使得目标句子修正为有误的句子,通过这些有误的句子得到了有标签的数据集,可以节约得到数据集的时间,避免人工标注的质量问题,使得得到的数据集可以更好的匹配不同的领域要求。
  • 一种搜索引擎文档打分方法及系统-202310875606.9
  • 黄震强 - 企知道科技有限公司
  • 2023-07-14 - 2023-10-24 - G06F40/216
  • 一种搜索引擎文档打分方法及系统,涉及大数据技术领域。在该方法中,响应于用户搜索引擎的搜索请求,获取召回文档;召回文档为对全部文档进行query召回后得到的文档;创建分数存储空间,并对分数存储空间进行分段,得到静态分段和动态分段,其中,动态分段包括多个动态区域;获取召回文档在静态分段的静态分段分数;基于用户设定的搜索语句和预设的索引规则,得到召回文档在多个动态区域对应的区域分数;将各个动态区域分数相结合,得到动态分段的动态分段分数;将动态分段分数与静态分段分数相结合,得到召回文档分数。实施本申请提供的技术方案,可以全面地对召回文档的分数进行计算,从而有效地提高文档召回率和搜索准确性。
  • 数据处理方法、装置、计算机设备及存储介质-202210331590.0
  • 谭瑞;吴海英;王洪斌;蒋宁;权佳成;李宽 - 马上消费金融股份有限公司
  • 2022-03-30 - 2023-10-24 - G06F40/216
  • 本申请公开了一种数据处理方法、装置、计算机设备及存储介质,涉及计算机技术领域。该方法包括:获取待服务用户的历史会话信息,以及根据历史会话信息确定待服务用户的用户标签,待服务用户的用户标签用于表征待服务用户的性格特征;根据待服务用户的用户标签确定符合待服务用户的目标沟通策略;根据目标沟通策略确定用于服务待服务用户的目标客服,目标客服擅长的沟通策略包括目标沟通策略。如此,可以更为准确地确定待服务用户的用户标签,以及确定出更合适服务该待服务用户的目标客服,进而提高对待服务用户的服务质量以及服务效率。
  • 一种基于自然语言处理的文本数据统计分析系统及方法-202010465823.7
  • 华志刚;郭荣;程卫国;汪勇;沈铭科 - 上海发电设备成套设计研究院有限责任公司
  • 2020-05-28 - 2023-10-20 - G06F40/216
  • 本发明公开了一种基于自然语言处理的文本数据统计分析系统,该系统包括自然语言信息抽取子系统、知识图谱管理子系统、数据分析子系统和图表可视化子系统:所述的自然语言信息抽取子系统包括语料预处理模块和知识抽取模块,所述的知识图谱管理子系统包括本体构建模块和数据配置模块,所述的数据分析子系统包括问题理解模块、图查询计算模块和语义匹配模块,所述的数据可视化子系统用于数据图表的生成和可视化展现;还提出一种基于自然语言处理的数据统计分析方法,该方法过利用自然语言处理技术和知识图谱技术建立知识库,再通过智能数据分析和可视化技术实现文本数据统计分析,将文本文档数据分析结果自动生成图表直观地展示,指导企业生产经营。
  • 基于属性值分布的人物实体属性对齐方法及系统-202110626786.8
  • 尹美娟;王灿;刘晓楠;胡倩;毛颖;罗向阳;薛鑫卓;刘又文 - 中国人民解放军战略支援部队信息工程大学
  • 2021-06-04 - 2023-10-20 - G06F40/216
  • 本发明属于计算机数据处理技术领域,特别涉及一种基于属性值分布的人物实体属性对齐方法及系统,通过获取不同数据来源的人物实体属性,并依据属性数据类型将人物实体属性划分为数值型属性和字符串型属性;针对数值型属性,通过核密度估计计算每个属性的属性值概率分布;针对字符串型属性,将其转化为语义向量,利用聚类算法对语义向量进行聚类来获取每个属性对应属性值概率分布;针对属性的属性值概率分布,采用双向匹配并利用交叉熵度量属性之间的相似性自动寻找存在对齐关系的属性对。本发明充分利用同一属性的属性值分布相似性特征,提高属性对齐的准确率以及召回率,自动识别存在对齐关系的属性对,具有较好的应用前景。
  • 实体词识别结果评价方法、装置、设备及实体词提取系统-201811644155.3
  • 韩勇;赵立永;吴新丽 - 新华网股份有限公司
  • 2018-12-29 - 2023-10-20 - G06F40/216
  • 本申请实施例提供了一种实体词识别结果评价方法、装置、设备及实体词提取系统。该方法包括:获取待识别文档集的实体词识别结果,其中,实体词识别结果是基于至少一种实体词识别方法,分别对待识别文档集进行实体词识别,确定出的任一实体词识别方法对应的实体词识别结果;确定至少一个实体词识别方法分别对应的实体词识别结果中的任一待评价实体词在待识别文档集的第一权值;基于任一待评价实体词的第一权值、至少一个实体词识别方法的准确率以及至少一个实体词识别方法的惩罚项系数,确定任一待评价实体词的第二权值,第二权值用于评价任一待评价实体词。本实施例的方案,通过第二权值判断实体词识别结果的正确性,有效提升实体词的识别效果。
  • 数据质量检测方法、装置、电子设备及介质-202110283424.3
  • 李鹏宇;郑毅;李剑锋 - 平安科技(深圳)有限公司
  • 2021-03-17 - 2023-10-20 - G06F40/216
  • 本发明涉及数据处理技术,揭露一种数据质量检测方法,包括:获取原始数据集,利用预构建的流畅度分析模型对原始数据集进行流畅度处理,得到流畅度值,利用预构建的语言模型对原始数据集进行困惑度分析,得到困惑度值,利用预构建的语法检测模型对原始数据集进行正确度检测处理,得到正确度值,利用预构建的监督模型对原始数据集中的对话数据进行匹配度检测,得到匹配度值;根据流畅度值、困惑度值、正确度值和匹配度值,分析得到原始数据集质量得分。本发明还涉及区块链技术,所述原始数据集质量得分可以存储在区块链节点中。本发明还揭露一种数据质量检测装置、电子设备及存储介质。本发明可以提高数据质量检测的准确性。
  • 文章评估方法及装置-202010917172.0
  • 方俊;林炳怀 - 腾讯科技(深圳)有限公司
  • 2020-09-03 - 2023-10-17 - G06F40/216
  • 本申请实施例公开了一种基于人工智能的文章评估方法及装置,该方法先获取待评估文章,然后调用训练后的神经网络,训练后的神经网络通过样本文章以及样本文章对应的低质量文章训练得到,最后使用训练后的神经网络得到待评估文章的文章评估结果;由于该方法所使用的神经网络是通过样本文章以及低质量文章训练得到的,其涉及的训练数据中的低质量文章是对样本文章进行处理得到的,大大降低了对样本数据量的要求,同时训练数据包括样本文章以及各样本文章对应的低质量文章,而低质量文章的评估结果是低于样本文章的评估结果的,这类低质量文章不需要人工评估即可,降低了主观因素对神经网络训练结果的影响。
  • 信源影响力的评估方法、装置、设备及可读介质-201911066574.8
  • 巩哲;陈张兵;吴成龙 - 中证征信(深圳)有限公司
  • 2019-11-04 - 2023-10-13 - G06F40/216
  • 本发明实施例公开了一种信源影响力的评估方法、装置、设备以及可读介质,所述方法包括:获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。本发明提高了信源影响力的评估的效率和准确率。
  • 一种文本处理的方法、装置、可读存储介质和电子设备-201911275301.4
  • 李超 - 拉扎斯网络科技(上海)有限公司
  • 2019-12-12 - 2023-10-13 - G06F40/216
  • 本发明实施例公开了一种文本处理的方法、装置、可读存储介质和电子设备。本发明实施例通过至少一个处理器解析所述数据,获取至少一个第一文本,对所述至少一个第一文本进行切分,确定第二文本集合,通过所述至少一个处理器获取所述第二文本的特征信息,根据所述第二文本的特征信息确定评价信息,根据所述评价信息确定至少一个所述第二文本中的至少一个切分关键词;确定所述第一文本的最终切分方式,以及所述最终切分方式对应的最终切分关键词;根据所述特征信息、所述最终切分方式以及所述最终切分关键词训练分词模型。通过上述方法训练处的分词模型可以自动对文本进行准确的切分,减少人力资源的消耗,并且提高了文本分词的准确性。
  • 一种语言序列模型解码方法-202010316825.X
  • 肖强;马祥祥 - 上海爱数信息技术股份有限公司
  • 2020-04-21 - 2023-10-13 - G06F40/216
  • 本发明涉及一种语言序列模型解码方法,包括:初始化:基于序列模型,利用贪心算法生成初始语言序列,通过构建有向图,分别得到初始语言序列中起点到终点当前最短路径长度、当前顶点到起点的最短路径长度;扩展:在序列模型中输入当前顶点信息,生成语言序列,根据语言序列中每个单词元素的条件概率,筛选得到临时顶点;裁剪:根据临时顶点的存在与否,筛选得到普通顶点;选择:从普通顶点中选择新的当前顶点,若该新的当前顶点对应单词元素为终点的单词元素,则起点到该新的当前顶点之间最短路径所对应语言序列即为全局最大发生概率序列,否则返回扩展阶段开始新一轮求解。与现有技术相比,本发明能够在解码过程中快速、准确求解得到全局最优解。
  • 一种文本处理方法及装置-202010559552.1
  • 严洁 - 中国银行股份有限公司
  • 2020-06-18 - 2023-10-13 - G06F40/216
  • 本申请公开了一种文本处理方法及装置,所述方法包括:获取手机银行的评论文本;对评论文本进行切词,获得评论文本的切词结果;基于预先构建的评论对象集合,提取切词结果中的评论对象;根据评论对象,利用依存语法获取评论对象对应的评论结果。采用本申请实施例的技术方案,通过预先构建的评论对象集合,能够获得手机银行评论文本中的评论对象及其评论内容,且手机银行的评论文本可以随时从应用商店获得,从而可以及时获得用户对于手机银行评论对象及其评论内容。无需再通过传统的方式获得用户的反馈,降低了评测成本,缩短了评测周期。
  • 获取热词的方法、装置、设备及介质-202310760781.3
  • 张海龙 - 中国第一汽车股份有限公司;一汽(北京)软件科技有限公司
  • 2023-06-26 - 2023-10-10 - G06F40/216
  • 本申请提供了一种获取热词的方法、装置、设备及介质。所述方法包括:响应于车辆满足目标条件,对所述车辆所处环境进行图像采集,得到目标图像;对所述目标图像进行热词提取,得到目标热词;其中,所述目标热词为所述车辆执行语音识别时采用的、具有最高优先级的备选词,由于车辆会在行驶过程中不断更新热词,且热词与车辆行驶环境相贴合,因此,通过目标热词辅助车辆语音识别可以提高车辆执行语音识别的准确度。
  • 一种基于卷积神经网络的程序编译错误信息特征提取方法-202011043236.5
  • 谷林;何烨辛 - 西安工程大学
  • 2020-09-28 - 2023-10-10 - G06F40/216
  • 本发明公开了一种基于卷积神经网络的程序编译错误信息特征提取方法,具体按照如下步骤进行;步骤1:构建Word2Vec的词向量提取模型;向输入层输入编译错误信息文本数据集,进行取词,构造编译错误信息词典并统计词频;在输出层构造树形结构,生成中间向量和词向量;训练中间向量和词向量;步骤2:构建卷积神经网络编译错误信息的表示模型;将训练后的中间向量和词向量输入到卷积神经网络输入层;进行局部的文本特征的提取;步骤3;进行进一步进行提取;在池化结束后设置全连接层,得到编译错误信息文本特征向量。本发明在编译错误信息数据中处理的数据量更大,维度更高,效果更有效。
  • 一种基于最大凝聚系数和边界熵的未登录词识别方法-202011013194.0
  • 韩东红;齐孝龙;杨百玉;蔡从浩;王波涛;刘辉林 - 东北大学
  • 2020-09-24 - 2023-10-03 - G06F40/216
  • 本发明提供了一种基于最大凝聚系数和边界熵的未登录词识别方法,其特征在于:包括以下步骤:预处理—参数计算—判断未登录词—未登录词保存至文件—未登录词添加;本发明中实验表明,本发明中所提出的算法准确率为66.67%相比于汪龙庆等在计算机应用与软件期刊中所发表的论文:基于未登录词识别的微博评价短语抽取方法中所提出的算法准确率为60.05%有较大程度的提高,提升了6.62个百分点,并且分别在未登录词识别的精确率、召回率和F1值也有所改善,推测结果提高的原因是左右邻接边界熵这两个参数对未登录词识别都有影响,但汪龙庆等的论文中中将左右邻接边界熵最小值设为一个参数,只是取其中最小值为影响未登录词识别算法的因素。
  • 基于特征强化的文本推荐方法、装置、设备及存储介质-202310802773.0
  • 张倩 - 平安科技(深圳)有限公司
  • 2023-06-30 - 2023-09-22 - G06F40/216
  • 本申请公开一种基于特征强化的文本推荐方法、装置、设备及存储介质,属于人工智能技术领域和互联网医疗领域。本申请通过将历史行为日志对应的内容数据作为正样本,对曝光数据进行采样,得到负样本,并构建训练样本集,对训练样本集中的样本进行特征表征,对特征表征进行动态加权,通过模型学习加权特征,并进行模型迭代更新,得到文本推荐模型,获取待推荐用户的用户特征表征,将用户特征表征输入到文本推荐模型,输出待推荐用户的文本推荐结果。本申请还涉及区块链技术领域,用户数据和用户行为日志可以存储在区块链节点上。本申请解决了医疗产险推荐系统中存在的样本选择偏差和数据稀疏问题,提高推荐系统的准确性和个性化程度。
  • 一种反事实样本的生成方法、相关装置、设备及存储介质-202210224101.1
  • 朱叶霜;张金超;周杰 - 腾讯科技(深圳)有限公司
  • 2022-03-07 - 2023-09-19 - G06F40/216
  • 本申请公开了一种反事实样本的生成方法,可应用的领域包括但不限于人机交互等领域。本申请包括:基于原始文本样本,通过文本分类模型获取类别概率分布;根据类别概率分布,确定原始文本样本中每个文本单元的关联分值;根据每个文本单元的关联分值,从原始文本样本中确定N个因果片段;对N个因果片段中的M个因果片段进行遮盖处理,得到目标文本样本;基于目标文本样本,通过文本生成模型获取M个目标片段;将原始文本样本中的M个因果片段替换为M个目标片段,得到反事实样本。本申请还提供了装置、设备及存储介质。本申请能够在无需人工介入的情况下,自动生成反事实样本,从而降低数据增广的成本。
  • 信息处理方法、装置、电子设备及存储介质-202211533177.9
  • 毛梦依;杨亚军 - 中移(苏州)软件技术有限公司;中国移动通信集团有限公司
  • 2022-12-01 - 2023-09-19 - G06F40/216
  • 本申请的技术方案提供了一种信息处理方法、装置、电子设备及存储介质,信息处理方法包括:获取目标信息;其中,所述目标信息为发送端发出的参考信息经过传输后接收端接收到的信息;所述参考信息和所述目标信息为同一会话中的信息;通过类型确定模型确定所述目标信息对应的应用程序接口的目标类型;在所述参考信息的参考类型和所述目标类型相同时,根据所述参考信息和所述目标信息确定所述目标信息是否为与所述参考信息相同的信息;其中,在所述目标信息与所述参考信息相同时,表示所述目标信息为完整信息。提高了确定接收端接收到的目标信息与参考信息是否相同的准确度,从而提高了数据传输的准确度。
  • 热点文章识别方法-202010502429.6
  • 姚洲鹏 - 杭州凡闻科技有限公司
  • 2020-06-03 - 2023-09-19 - G06F40/216
  • 本发明公开了一种热点文章识别方法包含以下步骤:获取若干热点文章构成热点文章库;提取热点文章库中的每一份热点文章的分词并统计每个分词所对应的词频构成热点词库;提取入库文章的分词并统计每个分词所对应的词频;计算入库文章的热度值;根据入库文章的热度值判定入库文章是否为热点文章。本发明的有益之处在于提供的热点文章识别方法能够根据现有的热点文章提炼出热点词库,再根据该热点词库计算新入库的入库文章的热度值,根据该热度值快速判定新入库的入库文章是否是热点文章。
  • 针对大数据安全的风险行为识别方法、装置、设备及介质-202211162301.5
  • 刘娇平 - 刘娇平
  • 2022-09-23 - 2023-09-19 - G06F40/216
  • 本发明涉及人工智能技术,揭露了一种针对大数据安全的风险行为识别方法,包括:生成信息风险案例的风险特征,提取用户的用户行为特征;利用预设的层级匹配算法计算风险特征与用户行为特征之间的层级匹配度;根据层级匹配度、风险特征及用户行为特征生成特征对,并根据所述特征对构建特征交叉决策树模型;获取用户实时行为,利用所述特征交叉决策树模型识别所述用户实时行为的风险系数,并确定所述风险系数大于预设阈值的用户实时行为为风险行为。此外,本发明还涉及区块链技术,数据列表可存储于区块链的节点。本发明还提出一种针对大数据安全的风险行为识别装置、电子设备以及存储介质。本发明可以提高针对大数据安全的风险行为识别效率。
  • 基于深度神经网络的网络安全关键词抽取方法-202010229237.2
  • 宋虹;陈济民;林丹丹;王伟平 - 中南大学
  • 2020-03-27 - 2023-09-19 - G06F40/216
  • 本发明公开了一种基于深度神经网络的网络安全关键词抽取方法,包括采集网络安全文本数据集;构建深度神经网络并对网络安全文本数据集进行训练得到训练后的深度神经网络模型;采用训练后的深度神经网络模型对分词系统词库进行扩展;对分词之后的文本集合进行文本关键词的抽取并得到最终的网络安全关键词抽取结果。本发明提出了一种深度神经网络来改进文本分词的不足,并通过文本中每个词语的位置以及词性来提取文本的关键词集合;因此,本发明方法能够有效的提取网络安全文本中的关键词集合,具有较高的准确率,而且可靠性高,实用性好。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top