[发明专利]语言信息主动校对系统及其主动校对方法在审

申请号：	201811506143.4	申请日：	2018-12-10
公开（公告）号：	CN109858014A	公开（公告）日：	2019-06-07
发明（设计）人：	朱西平;邓魁;李伟勤;苟智坚;韩斌;李季;郑达;帅靖;杨朋	申请（专利权）人：	西南石油大学;成都信息工程大学;四川品亿科技有限公司
主分类号：	G06F17/27	分类号：	G06F17/27;G06K9/34;G06F16/583;G06F16/51
代理公司：	成都众恒智合专利代理事务所(普通合伙) 51239	代理人：	钟显毅
地址：	610500 四***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种语言信息主动校对系统，包括用于提供标准语言的字符和单词的语言基本词字数据库，用于提供所采集的区域合作沿线多语言文字信息资料的语言图文识别数据库，进行初步自动识别的对比服务器，将对比服务器无法自动识别的结果进行记录的错词字记录服务器，用于发布来自于错词字记录服务器所记录数据的校对信息发布平台，用于接收校对信息发布平台所发布信息并反馈校对结果的主动校对终端，用于接收反馈的校对结果的审核服务器，以及与审核服务器连接的人工审核终端。本发明有效地扩展了校对的范围和准确度，有效克服了现有技术中机器识别不准确的情况，特别适合于区域合作沿线多语言文化信息交汇复杂的情况。
搜索关键词：	校对对比服务器记录服务器审核服务器校对结果校对系统校对信息语言信息自动识别词字区域合作发布终端多语言文字准确度反馈标准语言发布信息机器识别记录数据人工审核图文识别文化信息信息资料字数据库多语言有效地单词语言数据库交汇采集记录
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语言信息主动校对系统，其特征在于，包括用于提供标准语言的字符和单词的语言基本词字数据库，用于提供所采集的区域合作沿线多语言文字信息资料的语言图文识别数据库，参照语言基本词字数据库对所述语言图文识别数据库的资料进行初步自动识别的对比服务器，将对比服务器无法自动识别的结果进行记录的错词字记录服务器，用于发布来自于错词字记录服务器所记录数据的校对信息发布平台，用于接收校对信息发布平台所发布信息并反馈校对结果的主动校对终端，与校对信息发布平台连接的用于接收主动校对终端所反馈的校对结果的审核服务器，以及与审核服务器连接的人工审核终端，其中，所述主动校对终端由区域合作沿线语言文化爱好者使用，通过一定数量的区域合作沿线语言文化爱好者共同进行对错词字的主动校对。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西南石油大学;成都信息工程大学;四川品亿科技有限公司，未经西南石油大学;成都信息工程大学;四川品亿科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811506143.4/，转载请声明来源钻瓜专利网。

上一篇：一种有监督的词向量训练方法及装置
下一篇：一种基于CTW和KM算法的语义相似度计算方法及装置

同类专利

一种语音分析方法和系统-201910286514.0
发明人：邢启洲;李健;张连毅;武卫东 -专利权人：北京捷通华声科技股份有限公司
申请日： 2019-04-10 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本申请实施例公开了一种语音分析方法和系统，所述方法包括：通过接收和识别语音信息，将所述语音信息对应的文字通过第一映射算法确定第一关键词列表、通过第二映射算法确定第二关键词列表；根据所述第一关键词列表和所述第二关键词列表，确定包括至少一个关键词及每个关键词对应的第三权重的第三关键词列表；对所述第三关键词列表中的关键词进行语义特征提取和聚类，确定第四关键词列表；所述第四关键词列表包括至少一个语义类别、每个语义类别对应的关键词及每个关键词对应的第三权重；根据所述第四关键词列表，确定所述语音信息的分析结果并输出。从而可以快速又精准的确定关键词，并提升语音分析的效果。

情感智能判断方法、装置及计算机可读存储介质-201910530889.7
发明人：金戈;徐亮 -专利权人：平安科技（深圳）有限公司
申请日： 2019-06-18 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明涉及一种人工智能技术，揭露了一种情感智能判断方法，包括：接收语料集和标签集，将所述语料集进行预处理操作得到标准语料集；对所述标准语料集进行关键字抽取和词向量化操作得到词向量集；将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与预设阈值的大小，直至所述卷积神经网络退出训练；对用户输入的文本数据产生情感判断结果。本发明还提出一种情感智能判断装置以及一种计算机可读存储介质。本发明可以实现精准的情感智能判断功能。

一种问句实体识别方法、装置、计算机设备及存储介质-201910551194.7
发明人：朱威;李恬静 -专利权人：平安科技（深圳）有限公司
申请日： 2019-06-24 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本申请公开了一种问句实体识别方法，包括以下步骤：获取第一训练数据，并基于所述第一训练数据进行LSTM语言模型训练，获取第二训练数据，基于所述第二训练数据与所述训练完成的LSTM语言模型获取LSTM‑CRF模型的输入特征，基于所述输入特征训练所述LSTM‑CRF模型；利用训练完毕的LSTM‑CRF模型，对待预测的数据进行命名实体识别预测。本发明所示的问句实体识别方法，将基于语言模型的包含上下文信息的特征，加入到实体识别模型中，有利于模型捕捉上下文信息，有利于更好地检测特定垂直领域问句中的实体。

基于时间卷积网络的命名实体识别方法-201910602993.2
发明人：车超;赵撼宇;张强 -专利权人：大连大学
申请日： 2019-07-05 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明涉及一种基于时间卷积网络的命名实体识别方法。方法步骤为：首先构建特征表示层，其主要由词向量和字符特征层组成。词向量层和字符向量层分别接受单词和字符作为输入，分别将离散的One‑hot表示映射到各自的连续稠密的低维特征空间中。然后将词向量和字符级向量进行拼接以表示单词在特定语义空间下的特征。其次将拼接后的特征作为时间卷积网络的输入，经过融合卷积核大小不同的时间卷积网络提取不同特征，得到最终的特征h₁h₂…h_n。最后将得到的特征作为CRF层的输入，CRF对上下文标注进一步约束后，输出序列标注结果y₁y₂...y_n。本发明的TCN网络相较于现有的LSTM网络，识别精度稍有提高，训练时间仅为LSTM网络的约1/3。

一种融合语法信息的句子压缩方法-201910685953.9
发明人：赫志峰;陈诚;蔡瑞初;陈炳丰;温雯;王丽娟;陈渝升 -专利权人：广东工业大学
申请日： 2019-07-28 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明涉及句子压缩领域，公开了一种融合语法信息的句子压缩方法，包括步骤：S1、对句子压缩网络中的参数进行随机初始化；S2、从数据集获取压缩前句子的序列、词性序列和对应的压缩序列标签；S3、以时间步为单位，将原句子序列的每个单词以及词性序列中对应词性依次输入到网络中所对应的编码器中去；S4、把单词网络编码器最后一个时间步的隐状态作为单词解码器的初始隐状态，将词性网络编码器的最后一个时间步的隐状态作为词性解码器的初始隐状态；S5、将原句子序列的每个单词以及词性序列中对应词性依次输入到对应的解码器中；S6、生成标签的概率分布；S7、通过选择最大概率来得到当前输入单词的标签。可以有效简单通过语法信息进行句子压缩。

图像处理方法、装置、终端及计算机存储介质-201910693744.9
发明人：王伟航 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-07-30 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明实施例提供了一种图像处理方法、装置、终端及计算机存储介质，其中，所述方法包括：获取情绪数据及待处理的图像，识别所述情绪数据所反映的目标情绪，以根据所述目标情绪为所述待处理的图像匹配对应的目标滤镜模式，最后采用所述目标滤镜模式对所述待处理的图像进行滤镜处理，得到目标图像。采用本发明实施例，能够解决传统技术中存在的图像增强效果较差、无法准确表达用户的真实意图等问题。

文本信息处理方法、装置及设备-201910720434.1
发明人：赵岷;程健一;秦华鹏;吕雅娟 -专利权人：北京百度网讯科技有限公司
申请日： 2019-08-06 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明实施例提供一种文本信息处理方法、装置及设备，该方法包括：获取第一文本信息；对第一文本信息进行词类序列标注，得到第一文本信息对应的第一词类序列，根据第一词类序列获取第一文本信息对应的字词向量，对字词向量进行处理，得到第一文本信息对应的任务处理结果；其中，第一词类序列中包括多个词汇和每个词汇的词汇类别，多个词汇为第一文本信息中的词汇；字词向量包括字向量和/或词向量。提高了文本任务处理的精确性。

一种基于CBOW模型的热点工单获取方法及装置-201910726132.5
发明人：张逸彬;吴玮;陈晨;金瑞琼;郭超 -专利权人：云南电网有限责任公司信息中心
申请日： 2019-08-07 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本申请公开一种基于CBOW模型的热点工单获取方法及装置，所述方法包括：获取ITSM工单管理系统中的工单，构建语料；对语料中的特征文本进行处理，获得多个词条；将词条随机划分为训练数据集和应用数据集；用CBOW模型将训练数据集中的词条映射为第一词向量数据集，获得词向量空间模型；用词向量空间模型训练应用数据集，获得第二词向量数据集；计算第二词向量数据集中任意两个第二词向量之间的语义相似度；将语义相似度大于第一预设阈值的第二词向量聚类，将聚类后第二词向量对应的词条作为目标词条；计算聚类后每一类下目标词条的TF‑IDF值，获取特征关键词，该特征关键词对应的工单为热点工单。采用前述方法，可提高热点工单获取效率。

一种文本审核方法、装置及系统-201910741766.8
发明人：杨溥;郭宏洲;徐唐;沈仁奎;邓鑫鑫 -专利权人：北京思维造物信息科技股份有限公司
申请日： 2019-08-12 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本申请公开了一种文本审核方法、装置及系统，用于实现更为准确的文本审核。该方法：根据敏感词表确定文本的第一分数；根据审核模型确定文本第二分数；根据第一分数、第二分数确定文本在第k个违禁类别上的评分，判断文本是否包含违禁内容。该系统：审核模块，根据第一模型和第一敏感词表对文本审核，输出审核结果；模型训练模块，根据历史数据训练第二模型并评估第二模型的性能；若第二模型的性能高于第一模型，将第二模型发给审核模块；敏感词评估模块，获取第二敏感词表，用第二模型对第二敏感词表评估，根据评估结果调整第二敏感词，将调整后的第二敏感词表发给审核模块；审核模块将第二模型替换第一模型，根据第二敏感词表更新第一敏感词表。

一种评价语义相似度的方法、装置和系统-201510003802.2
发明人：马林;刘凯;熊皓 -专利权人：华为技术有限公司
申请日： 2015-01-04 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明实施例提供了一种评价语义相似度的方法、装置和系统，涉及机器翻译领域，用以解决现有技术对于词汇调序的句子无法正确评价语义相似度的问题。该方法包括：将第一句子中的词汇和第二句子的词汇分别进行词汇向量化处理得到第一词汇向量和第二词汇向量，将该第一词汇向量根据第一压缩编码参数按照预设的词向量压缩顺序进行压缩编码处理得到第一语句向量；将该第二词汇向量根据第二压缩编码参数按照预设的词向量压缩顺序进行压缩编码处理得到第二语句向量；确定该第一语句向量和该第二语句向量之间的向量距离，根据该向量距离评价该第一句子与该第二句子的语义相似度。该方法用于评价语义的相似度。

一种基于深度学习的用户情感分析方法-201710473195.5
发明人：李瑞轩;文坤梅;昝杰;李玉华;辜希武;杨琪;代德顺;张镇 -专利权人：华中科技大学
申请日： 2017-06-21 - 公布日： 2019-11-12 - 主分类号： G06F17/27
摘要：本发明公开了一种基于深度学习的用户情感分析方法，其中，方法的实现包括数据预处理、词向量学习、文本向量学习、用户特征向量表示、用户情感分析以及模型更新。本发明方法使用用户发表的文本信息提取用户的特征向量，并基于该用户特征向量及词向量信息实现基于用户特征的文本情感分析，基于本发明不仅优化了用户特征学习的复杂程度、而且得到的用户特征向量具有更丰富的用户画像信息，使得基于该用户特征向量及词向量对文本进行情感分析时提升了情感分析的准确度及效率。

一种基于智能机器人的电网事故事件分析方法及系统-201910499305.4
发明人：陈恩黔;单克;代江;赵倩;田年杰 -专利权人：贵州电网有限责任公司
申请日： 2019-06-11 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：本发明公开的一种基于智能机器人的电网事故事件分析方法及系统，分析方法包括：S101、通过广域测量系统采集电网设备实时运行数据，过滤无效数据，提取有效数据形成数据样本；S102、将采集到的数据发送至调度中心；S103、将采集到的数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作，同时发送至显示单元；S104、将接收到的数据信息进行显示；通过对机器学习原理的解析和应用，特别是决策树算法跟电网事故事件回溯的结合应用，大大的提高了电网事故事件回溯效率性、客观性和可靠性，从而提高事故事件处置效率和减少后续风险发生可能性。

文本分析方法、装置、计算机装置及计算机存储介质-201910555929.3
发明人：金戈;徐亮 -专利权人：平安科技（深圳）有限公司
申请日： 2019-06-25 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：本发明属于人工智能技术领域，提供了一种文本分析方法、装置、计算机装置及存储介质。所述文本分析方法包括：获取待分析文本；将所述待分析文本的各个词语转换为词向量；将所述词向量输入情感识别模型中的双向长短时记忆递归神经网络，得到所述待分析文本的各个词语的特征向量；计算所述特征向量的权重；将所述特征向量与对应的所述权重相乘，得到经过权重调整后的特征向量；将所述经过权重调整后的特征向量输入所述情感识别模型中的全连接层，得到所述待识别文本的情感类别。本发明提高了文本感情分类的效率和准确性。

文本处理方法、装置、设备及存储介质-201910560145.X
发明人：纪桂锋 -专利权人：深圳追一科技有限公司
申请日： 2019-06-26 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：本申请公开了一种文本处理方法、装置、设备及存储介质，属于文本处理领域。所述方法包括：对待处理的文本进行语义识别，得到至少一个语义识别结果；对该文本进行命名实体识别，得到至少一个命名实体；将该至少一个语义识别结果与该至少一个命名实体进行关联，得到该文本的关联结果，该文本的关联结果用于表征每个语义识别结果与命名实体之间的对应关系。本申请实施例提供的技术方案解决了从文本中抽取到的有价值的信息的有效性较差的问题。

语料标注的评估方法、装置及存储介质-201910668462.3
发明人：童丽霞;雷植程 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-07-23 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：本申请涉及一种语料标注的评估方法、装置及存储介质，该语料标注的评估方法包括：从语料库中获取至少一条待评估语料、以及每条待评估语料的第一初始标注；根据待评估语料和语料库中剩余语料确定待评估语料的第一标注；利用已训练的分类模型确定待评估语料的第二标注；根据第一标注和第二标注，确定对应待评估语料的第一初始标注的评估结果，从而在进行人工语料复查时，能够根据评估结果选择标注准确性不高的语料进行复查，进而无需对语料库中所有语料进行一一复查，减少了语料标注人员的工作量，提高了语料复查效率。

基于神经网络算法的web资产分类检测方法及装置-201910714955.6
发明人：孙学军;范渊 -专利权人：杭州安恒信息技术股份有限公司
申请日： 2019-08-02 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：本发明提供了一种基于神经网络算法的web资产分类检测方法及装置，包括：获取待分类web资产的网页内容，对网页内容清洗处理；对清洗处理的网页内容预处理，得到特征分词；对特征分词向量化处理，得到待分类web资产的特征向量；采用分类神经网络模型对待分类web资产的特征向量分类处理，得到待分类web资产的类别信息。该方法在对待分类web资产进行分类时，最终得到的特征向量中涵盖有网页内容特征，在通过分类神经网络模型对待分类web资产的特征向量进行分类处理后，得到的待分类web资产的类别信息准确性好。

半监督文本简化模型训练方法和系统-201910744141.7
发明人：俞凯;赵晏彬 -专利权人：苏州思必驰信息科技有限公司;上海交通大学
申请日： 2019-08-13 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：本发明公开半监督文本简化模型训练方法和系统，其中，方法包括：建立复杂句到简单句的转化模型Comp2Simp和简单句到复杂句的回译模型Simp2Comp；分别对Comp2Simp和Simp2Comp进行初始化；利用初始化后的Simp2Comp构造第一平行语料对，利用初始化后的Comp2Simp构造第二平行语料对；利用第一平行语料对对初始化后的Comp2Simp的进行有监督训练，利用第二平行语料对对初始化后的Simp2Comp的进行有监督训练，从而完成第一轮迭代；分别利用参数更新后的Simp2Comp和Comp2Simp重复执行上述构造平行语料对和更新模型参数的过程完成后续迭代。

新词发现方法及系统-201810728830.4
发明人：赵汉光;王珵;戴文渊 -专利权人：第四范式（北京）技术有限公司
申请日： 2018-07-05 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：提供一种新词发现方法和系统。所述新词发现方法包括：通过对文本中的各个句子进行分割来获得第一候选词集合；通过第一词典的词性规律来对第一候选词集合进行筛选以获得第二候选词集合；通过第二词典从每个句子获得分词，并根据第二候选词集合中的候选词的边界字与分词的边界字之间关系来确定候选词系数；根据第二候选词集合中的候选词的内部凝聚程度和边界自由程度来调整候选词系数，并根据调整的候选词系数从第二候选词集合中筛选出新词，其中，第一词典与第二词典相同或不同。根据所述新词发现方法和系统，能够减少特定词性和词典对新词发现结果的影响，能够通过边界关系、内部凝聚程度和边界自由程度获得候选词系数，使新词发现结果更准确。

多语言数据输入系统-201880018004.9
发明人： J·奥斯本;A·班扬 -专利权人：微软技术许可有限责任公司
申请日： 2018-03-07 - 公布日： 2019-11-08 - 主分类号： G06F17/27
摘要：描述了一种具有用户接口的数据输入系统，所述用户接口接收由用户输入的文本项序列中的一个或多个上下文文本项。数据输入系统的处理器使用多个语言模型来从每个语言模型预测所述文本项序列中的接下来的项。处理器使用动态模型来预测所述文本项序列中的接下来的项，该动态模型是作为学习用户先前使用的文本项的结果而对用户定制的。处理器至少使用每术语权重来对从动态模型预测的接下来的项进行加权，每个每术语权重表示在给定所述语言模型中的一个语言模型的情况下动态模型的相关联的术语的可能性。

电子病历的质检方法、相似病历的提醒方法及装置-201810391354.1
发明人：程钰淇;仇伟;潘熙;陈漠沙;姜伟伟;史伟男;陈磊;鲍华俊;李兆融;李林琳 -专利权人：阿里巴巴集团控股有限公司
申请日： 2018-04-27 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本说明书一个或多个实施例提供一种电子病历的质检方法、相似病历的提醒方法及装置，该电子病历的质检方法可以包括：确定待检验病历片段；从历史病历片段中查找所述待检验病历片段的候选相似病历片段；计算所述待检验病历片段与所述候选相似病历片段之间的文本相似程度；当所述文本相似程度满足预设条件时，判定所述候选相似病历片段为所述待检验病历片段的相似病历片段。

一种情绪识别方法及装置-201810393981.9
发明人：何耀;蒋松岐;刘笑逸 -专利权人：北京海马轻帆娱乐科技有限公司
申请日： 2018-04-27 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本申请实施例公开了一种情绪识别方法，首先从待识别文本中提取获取至少一条待识别语句，然后按照预设判定规则对所述待识别语句的句法结构及角色关系进行分析，确定与目标角色相关的待识别语句，最后根据与目标角色相关的待识别语句，确定目标角色的情绪。由于采用了与目标角色相关的待识别语句进行情绪识别，避免了其他角色的情绪对目标角色的情绪识别产生干扰，可以根据需求对不同角色分别进行情绪识别，提高了情绪识别的准确率，满足了用户的需求。本申请实施例还公开了一种情绪识别装置。

词向量的配置方法、装置、存储介质、电子装置-201910534810.8
发明人：郑立颖;徐亮;阮晓雯 -专利权人：平安科技（深圳）有限公司
申请日： 2019-06-20 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明提供了一种词向量的配置方法、装置、存储介质、电子装置，其中，本发明提供的词向量的配置方法包括：确定待配置初始词向量的第一词汇；判断第一词汇是否在词向量词典中，其中，词向量词典用于存储多个词汇与多个词向量的一一对应关系；如果判断出第一词汇不在词向量词典中，对第一词汇执行笔画拆解，得到笔画序列；计算词向量词典中的每个词汇的笔画序列与第一词汇的笔画序列的相似度；确定与第一词汇的笔画序列相似度最高的词汇对应的词向量，并配置为第一词汇的初始词向量。通过本发明，解决了相关技术中利用随机分配的方式配置未登录词的词向量时导致后续训练任务精度下降的技术问题。

一种基于修辞使用的小学语文作文自动评价方法-201910539388.5
发明人：杨宗凯;殷姿;董鑫;谯宇同;龚颖;石昀东;刘三女牙;朱晓亮 -专利权人：华中师范大学
申请日： 2019-06-20 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明属于教育信息化领域，提供一种基于修辞使用的小学语文作文自动评价方法，首先，实现作文基础评分特征的识别与自动抽取，然后获取修辞类评分特征。将四类作文作为选取评价器的参考因素，得到一个适用于各类作文类别的评价器。最后，得到基于各个评分特征的评价结果信息，供写作者参考改进。本发明一种基于修辞使用的小学语文作文的自动评价方法，能够实现基础教育阶段作文自动化评测。

一种语义分析识别方法、系统、介质和设备-201910558050.4
发明人：彭德光;孙健 -专利权人：重庆兆光科技股份有限公司
申请日： 2019-06-26 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明提出一种语义分析识别方法、系统、介质和设备，包括：根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；根据所述语料库和所述逻辑库，训练词义识别模型，获取语料库词义特征向量；根据所述语料库和所述逻辑库，训练句义识别模型，获取语料库句义特征向量；根据所述语料库的词义特征向量、句义特征向量和所述逻辑库，训练融合模型，获取语料特征和所述语料库文本的对应关系；获取待解析文本的词义特征向量和句义特征向量；根据所述待解析文本的词义特征向量、句义特征向量和所述逻辑库，结合所述融合模型，获取语义识别结果；本发明可以有效提高自然语言识别的准确性。

一种基于稀疏权值神经网络的语义分类方法、系统和介质-201910558051.9
发明人：孙健;彭德光;唐贤伦 -专利权人：重庆兆光科技股份有限公司
申请日： 2019-06-26 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明提出一种基于稀疏权值神经网络的语义分类方法、系统和介质，包括：设置样本集，将所述样本集中的文本序列转换成词向量，根据所述词向量计算得到文本向量；对所述样本集进行标注，根据已标注样本，创建样本分类训练目标；创建神经网络分类模型，计算所述样本分类训练目标的输出概率，并根据所述输出概率构造所述文本分类训练目标的最大似然函数；对所述神经网络分类模型的输入层权重进行稀疏处理，获取稀疏正则函数；将所述稀疏正则函数加入所述最大似然函数，构建所述神经网络的目标函数，并根据所述目标函数对所述神经网络分类模型进行训练，获取语义分类神经网络模型；本发明可以提高分类算法的计算速度和泛化能力。

一种面向电力行业的自适应中文分词方法及其系统、介质-201910638948.2
发明人：张云翔;饶竹一 -专利权人：深圳供电局有限公司
申请日： 2019-07-16 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明涉及一种面向电力行业的自适应中文分词方法及其系统、介质，所述方法包括：S1、获取候选文本术语，所述候选文本术语为待分词的短句或段落；S2、对所述候选文本术语进行分割处理得到多个候选文本语句；S3、对每一候选文本语句进行切分得到一个或多个分词；S4、逐一将候选文本术语中的分词替换为与分词词意相同的词汇并进行语义判别，若出现歧义，则返回S3，若没有歧义，则保留该分词作为候选分词；S5、获取与候选分词语义相似的一个或多个电力领域专业词汇，计算候选分词与一个或多个电力领域专业词汇的相似度并根据相似度确定最终分词；S6、将最终分词按分词在所述候选文本术语中出现的频次进行排序后输出。

一种基于法理图规则引擎的法律概念识别方法-201910714738.7
发明人：倪有发;杜向阳 -专利权人：南京擎盾信息科技有限公司
申请日： 2019-08-02 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明公开了一种基于法理图规则引擎的法律概念识别方法，本发明将代表法律专家知识的法律图和规则引擎结合起来，实现了逻辑关系推理的法律概念识别；本发明构建一个法律概念法理逻辑图，每个法律概念可以看成是法理图上的一个结点，法理图确定了法律概念间的逻辑关系，使用法理图来指导法律概念识别的逻辑正确性。本发明在生成法律概念规则树步骤中，将法律专家整理的规则生成法律概念规则树，使得法律概念识别逻辑更加直观，更加具有可解释性。本发明创造性的提出了BSFC算法，实现了法理图的广度优先条件遍历。

基于机器学习的大数据处理方法-201811039771.6
发明人：不公告发明人 -专利权人：贵州航天云网科技有限公司
申请日： 2018-09-06 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明提供了一种基于机器学习的大数据处理方法，包括：给定一个检索语句，使用通用的停用词表对初始检索中的词进行过滤，保留有意义的检索词；使用语义块模型对词汇进行语义向量表示；在语义向量的基础上针对每个初始检索词采用余弦相似度从其它词汇中找出与之相似度最接近的多个词，作为扩展检索词；使用初始检索中对应的扩展检索词在初始检索语句中进行替换，将新生成的检索词序列作为扩展检索语句；根据扩展检索词的排列组合得到不同表达形式的扩展检索语句。本发明改进了MAPRUDUCE的并行框架，更好地适应文本数据挖掘的需要；并且针对社交文本的不规范特点，利用语义向量对文本数据进行有效表示和分析，适用于各种规模的社交文本挖掘分析和计算。

题目相似度的计算方法及装置-201610304614.8
发明人：熊蜀光;黄琰;杨力学;白建国 -专利权人：北京新唐思创教育科技有限公司
申请日： 2016-05-10 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：本发明提供了一种题目相似度的计算方法及装置，其中，该计算方法包括：基于题库中所有题目生成特征词语集；基于所述特征词语集获得每道题目的特征向量；根据当前题目的特征向量和题库中其它题目的特征向量分别计算当前题目与题库中其它题目之间的相似度值。本发明能够极大地提高老师和教辅人员寻找相似题目的效率，从而能够提高老师的教学效率和学生的学习效率。

孤立话语检测系统和方法-201580045271.1
发明人： G·图尔;A·德欧拉斯;D·哈卡尼-图尔 -专利权人：微软技术许可有限责任公司
申请日： 2015-08-20 - 公布日： 2019-11-05 - 主分类号： G06F17/27
摘要：孤立项检测器。孤立项检测器处理来自目标语言理解对话系统的域外话语，以确定该域外话语是否表达了特定意图，该特定意图使得目标语言理解对话系统在回退处理(诸如执行通用web搜索)不大可能被web搜索满意的情况下采取特定动作。这种话语被称为孤立项，因为其无法被任意任务域或回退处理适当地处理。孤立项检测器通过主要关注于话语的结构而不是内容来将孤立项从web搜索查询和其他域外话语中区分。由孤立项检测器检测到的孤立项可以在线和离线使用以改进目标语言理解对话系统的用户体验。孤立项检测器还可以用于从web搜索引擎查询日志中挖掘结构上相似的查询或句子。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语言信息主动校对系统及其主动校对方法在审

专利文献下载