“分词”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果10021个，建议您升级VIP下载更多相关专利

[发明专利]分词方法和分词系统-CN201610251640.9有效
发明人：陈炳标 -专利权人：广东万丈金数信息技术股份有限公司
申请日： 2016-04-20 - 公布日： 2018-10-26 - 主分类号： G06F17/27 文献下载
摘要：本发明公开了一种分词方法和分词系统，所述方法包括：接收输入的待测文本；根据预设划分标识对待测文本进行划分；根据预先建立的字典分别对各个新文本进行正向最大匹配分词和反向最大匹配分词；比较两次匹配后的分词结果是否相同；当比较结果相同时，输出任意一个匹配后的分词结果；当比较结果不同时，根据所述字典分别计算两次匹配后的分词结果中各个词的词频；判断两次匹配后的分词结果中各个词的词频是否符合第一要求；当判定不符合时，根据所述字典分别判断两次匹配后的分词结果的语法是否正确；当判定正向匹配分词结果的语法正确时，输出正向匹配分词结果，否则输出反向匹配分词结果。本发明提高分词速度和准确率，满足实际应用需要。
分词方法系统

[发明专利]分词方法及分词装置-CN201910036059.9有效
发明人：王潇斌;谢朋峻;马春平;李林琳;司罗 -专利权人：阿里巴巴集团控股有限公司
申请日： 2019-01-15 - 公布日： 2023-04-18 - 主分类号： G06F40/284 文献下载
摘要：本发明实施例提供了一种分词方法以及分词装置。分词方法包括：确定目标文本的每个字符对应的匹配概率集合，所述匹配概率集合中的匹配概率与隐变量一一对应，所述匹配概率用于表征所述字符与对应的隐变量之间的匹配关系，所述隐变量用于标识所述字符在分词结果的位置以及所属的领域；根据各个字符对应的所述匹配概率集合，预测各个字符在分词结果中的位置以及所属的领域，以确定所述目标文本的分词结果。
分词方法装置

[发明专利]分词方法和装置-CN201910164080.7有效
发明人：焦伟;陈孝良;冯大航;常乐 -专利权人：北京声智科技有限公司
申请日： 2019-03-05 - 公布日： 2023-04-18 - 主分类号： G06F40/289 文献下载
摘要：本申请公开了一种分词方法和装置，通过获取待分词文本；根据前向字典树，对待分词文本进行前向最大匹配分词，得到前向分词结果；根据后向字典树，对待分词文本进行后向最大匹配分词，得到后向分词结果；判断前向分词结果的词数与后向分词结果的词数是否相同；若前向分词结果的词数与后向分词结果的词数相同，则将前向分词结果作为待分词文本的分词结果；若前向分词结果的词数与后向分词结果的词数不相同，则将词数较少的分词结果作为所述待分词文本的分词结果。本申请由于采用了字典树进行分词，分词的速度得到了提高。并且通过采用前向最大匹配分词和后向最大匹配分词，提高了分词的准确率。
分词方法装置

[发明专利]一种个性化并行分词处理系统及其处理方法-CN201210435504.7有效
发明人：王忠民;贺炎;齐静娜;张荣;宋辉;范琳 -专利权人：西安邮电大学
申请日： 2012-11-05 - 公布日： 2013-03-20 - 主分类号： G06F17/30 文献下载
摘要：本发明涉及一种个性化并行分词处理系统及其处理方法。本发明包括分词请求模块、基于个性化分词词典的分词模块、基于总分词词典的分词模块、控制模块、高速分词处理模块，用户的分词请求同时发送给基于个性化分词词典的分词模块和基于总分词词典的分词模块，基于个性化分词词典的分词模块如果命中，则将分词处理结果通过控制模块返回至分词请求模块，同时中断分词请求模块对基于总分词词典的分词模块的分词请求；否则，根据基于总分词词典的分词模块的分词处理结果，通过控制模块按照最早最少使用原则对个性化分词词典进行动态更新本发明可在满足分词准确率的同时极大地提高系统的分词效率，满足了移动用户高效的查询需求。
一种个性化并行分词处理系统及其方法

[发明专利]用于搜索引擎的分词处理方法和装置-CN201110378434.1无效
发明人：李理 -专利权人：北京趣拿信息技术有限公司
申请日： 2011-11-24 - 公布日： 2012-04-04 - 主分类号： G06F17/27 文献下载
摘要：本发明提供一种用于搜索引擎的分词处理方法和装置，该用于搜索引擎的分词处理方法，包括：获取用户输入的目标分词语句；根据预先存储的分词词典对目标分词语句进行分词；在确认出现分词歧义字段时，调用预先建立的分词统计模型，并选择分词歧义字段在所述分词统计模型中具有最高概率的分词方式进行分词。装置包括：第一获取模块，用于获取用户输入的目标分词语句；第一分词模块，用于根据预先存储的分词词典对目标分词语句进行分词；第二分词模块，用于在确认出现分词歧义字段时，调用预先建立的分词统计模型，并选择所述分词歧义字段在所述分词统计模型中具有最高概率的分词方式进行分词
用于搜索引擎分词处理方法装置

[发明专利]一种公式抄袭检测方法及系统-CN201610021492.1有效
发明人：夏峰 -专利权人：夏峰
申请日： 2016-01-13 - 公布日： 2018-03-16 - 主分类号： G06F17/27 文献下载
摘要：其中，对比库，收录素材；分词库，收录分词及对应词性；所述分词库进一步包含公式库；分词模块进行分词；分词特征值生成模块生成分词词性特征值；分词自由向量维数确定模块确定分词自由向量维数；分词精简向量维数生成模块，生成分词精简向量维数；分词特征向量生成模块，生成分词特征向量；待鉴定文档分词模块用于对待鉴定文档进行分词，得到分词结果；待鉴定文档分词自由向量维数确定模块，确定分词自由向量维数；待鉴定文档分词精简向量维数生成模块，生成待鉴定文档分词精简向量维数；待鉴定文档分词特征向量生成模块，生成待鉴定文档分词特征向量；进行相似度比对。
一种公式抄袭检测方法系统

[发明专利]基于人工智能的分词方法及装置-CN201710183974.1在审
发明人：肖求根;詹金波;郑利群;高庆;付志宏;何径舟 -专利权人：北京百度网讯科技有限公司
申请日： 2017-03-24 - 公布日： 2017-07-14 - 主分类号： G06F17/27 文献下载
摘要：本发明提出一种基于人工智能的分词方法及装置，其中，方法包括在屏幕上显示分词模型对目标文本的分词结果；其中，分词结果中包括分词模型输出的多个分词，在分词结果中存在分词边界错误的目标分词时，对分词结果进行修正得到修正分词结果，根据修正分词结果重新对分词模型进行训练。本实施例提供了一种交互式的分词模式，用户可以灵活地对存在分词边界错误的分词进行修正，使得分词结果更加准确。进一步地，还可以将修正后的分词结果反馈给分词模型，以重新对分词模型进行训练，使得分词模型的输出更加精确，能够自适应地适配用户的应用场景。
基于人工智能分词方法装置

[发明专利]一种滑动窗口文献检测方法及系统-CN201610020696.3有效
发明人：夏峰 -专利权人：夏峰
申请日： 2016-01-13 - 公布日： 2018-06-01 - 主分类号： G06F17/27 文献下载
摘要：其中，对比库，收录素材；分词库，收录分词及对应词性；分词模块进行分词；分词特征值生成模块生成分词词性特征值；分词自由向量维数确定模块确定分词自由向量维数；分词精简向量维数生成模块，生成分词精简向量维数；分词特征向量生成模块，生成分词特征向量；待鉴定文档分词模块用于对待鉴定文档进行分词，得到分词结果；待鉴定文档分词自由向量维数确定模块，确定分词自由向量维数；待鉴定文档分词精简向量维数生成模块，生成待鉴定文档分词精简向量维数；待鉴定文档分词特征向量生成模块，生成待鉴定文档分词特征向量；进行相似度比对。
分词鉴定文档生成模块特征向量向量维数自由向量分词模块滑动窗口维数确定文献检测词性维数相似度比对分词结果模块确定词库素材

[发明专利]一种网络查重方法及系统-CN201610019274.4有效
发明人：夏峰;洪学文;曾文斌 -专利权人：湖南通远网络科技有限公司
申请日： 2016-01-13 - 公布日： 2018-05-22 - 主分类号： G06F17/27 文献下载
摘要：其中，对比库，收录素材；分词库，收录分词及对应词性；分词模块进行分词；分词特征值生成模块生成分词词性特征值；分词自由向量维数确定模块确定分词自由向量维数；分词精简向量维数生成模块，生成分词精简向量维数；分词特征向量生成模块，生成分词特征向量；待鉴定文档分词模块用于对待鉴定文档进行分词，得到分词结果；待鉴定文档分词自由向量维数确定模块，确定分词自由向量维数；待鉴定文档分词精简向量维数生成模块，生成待鉴定文档分词精简向量维数；待鉴定文档分词特征向量生成模块，生成待鉴定文档分词特征向量；进行相似度比对。
一种网络方法系统

[发明专利]一种基于采样的文献检测方法及系统-CN201610019515.5有效
发明人：夏峰;洪学文;曾文斌 -专利权人：湖南通远网络科技有限公司
申请日： 2016-01-13 - 公布日： 2018-10-09 - 主分类号： G06F17/30 文献下载
摘要：其中，对比库，收录素材；分词库，收录分词及对应词性；分词模块进行分词；分词特征值生成模块生成分词词性特征值；分词自由向量维数确定模块确定分词自由向量维数；分词精简向量维数生成模块，生成分词精简向量维数；分词特征向量生成模块，生成分词特征向量；待鉴定文档分词模块用于对待鉴定文档进行分词，得到分词结果；待鉴定文档分词自由向量维数确定模块，确定分词自由向量维数；待鉴定文档分词精简向量维数生成模块，生成待鉴定文档分词精简向量维数；待鉴定文档分词特征向量生成模块，生成待鉴定文档分词特征向量；进行相似度比对。
一种基于采样文献检测方法系统

[发明专利]一种论文抄袭检测方法及系统-CN201610020719.0有效
发明人：夏峰;洪学文;曾文斌 -专利权人：湖南通远网络科技有限公司
申请日： 2016-01-13 - 公布日： 2018-05-22 - 主分类号： G06F17/22 文献下载
摘要：其中，对比库，收录素材；分词库，收录分词及对应词性；分词模块进行分词；分词特征值生成模块生成分词词性特征值；分词自由向量维数确定模块确定分词自由向量维数；分词精简向量维数生成模块，生成分词精简向量维数；分词特征向量生成模块，生成分词特征向量；待鉴定文档分词模块用于对待鉴定文档进行分词，得到分词结果；待鉴定文档分词自由向量维数确定模块，确定分词自由向量维数；待鉴定文档分词精简向量维数生成模块，生成待鉴定文档分词精简向量维数；待鉴定文档分词特征向量生成模块，生成待鉴定文档分词特征向量；进行相似度比对。
一种论文抄袭检测方法系统

[发明专利]一种文献联合检测方法及系统-CN201610020489.8有效
发明人：夏峰 -专利权人：夏峰
申请日： 2016-01-13 - 公布日： 2018-04-13 - 主分类号： G06F17/22 文献下载
摘要：其中，对比库，收录素材；分词库，收录分词及对应词性；分词模块进行分词；分词特征值生成模块生成分词词性特征值；分词自由向量维数确定模块确定分词自由向量维数；分词精简向量维数生成模块，生成分词精简向量维数；分词特征向量生成模块，生成分词特征向量；待鉴定文档分词模块用于对待鉴定文档进行分词，得到分词结果；待鉴定文档分词自由向量维数确定模块，确定分词自由向量维数；待鉴定文档分词精简向量维数生成模块，生成待鉴定文档分词精简向量维数；待鉴定文档分词特征向量生成模块，生成待鉴定文档分词特征向量；进行相似度比对。
一种文献联合检测方法系统

[发明专利]文本分词方法、装置、电子设备及计算机可读存储介质-CN202110432388.2在审
发明人：于福超;郭峰;高杨 -专利权人：亚信科技（南京）有限公司
申请日： 2021-04-21 - 公布日： 2022-06-14 - 主分类号： G06F40/289 文献下载
摘要：本申请实施例提供了一种文本分词方法、装置、电子设备及计算机可读存储介质，涉及文本处理技术领域。该方法包括：获取待分词文本；基于样本词汇库中词汇的分词等级进行第一次分词，基于预设的分词模型进行第二次分词，并确定待分词文本的可分词词汇和各可分词词汇的重要性系数，计算概率最大的分词组合确定为所述待分词文本的分词结果本申请实施例通过第一次分词，保证优先级高的词汇会被优先分词，不会被覆盖，通过模型继续分词，保证所有待分词文本都能够被分词，再通过确定可被分词的词汇，并计算各可被分词的词汇的重要性系数，采用预设的分词组合概率算法，计算概率最大的分词组合，确定待分词文本的分词结果，保证分词的准确性。
文本分词方法装置电子设备计算机可读存储介质

[发明专利]中文分词歧义消除方法和系统-CN201610596761.7有效
发明人：柳艳红;郭祥;郭瑞 -专利权人：北京智能管家科技有限公司
申请日： 2016-07-26 - 公布日： 2018-10-23 - 主分类号： G06F17/27 文献下载
摘要：本发明实施例提供一种中文分词歧义消除方法和系统，所述方法包括：对待分词语句进行分词，获得初始分词结果；针对初始分词结果，提取分词歧义点；构造包含分词歧义点的新分词，并计算新分词的最大熵模型得分；根据新分词的最大熵模型得分，判断新分词是否为有效分词；用有效分词修正初始分词结果。本发明实施例克服了现有技术中需要大量训练语料数据和歧义语料库的缺点，分词效果达到实用的精度。
中文分词歧义消除方法系统

[发明专利]中文分词方法及装置-CN200710102082.0无效
发明人：王启明 -专利权人：腾讯科技（深圳）有限公司
申请日： 2007-05-14 - 公布日： 2007-11-14 - 主分类号： G06F17/28 文献下载
摘要：本发明公开了一种中文分词方法，包括：为分词集合中的分词赋权值，所述分词集合中的分词按照分词在句子中的位置排序；从所述分词集合的最后一个分词开始，记录当前分词的权值与其在前分词到句尾的距离的和，作为当前分词到句尾的距离，标记该在前分词与当前分词的拼接关系，直到得到分词集合中第一个分词到句尾的距离，及所述第一个分词与其在前分词的拼接关系；从所述分词集合的第一个分词开始，选择所述到句尾的距离最短的句首分词，所述句首分词的第一个字为所述句子的第一个字；从所述句首分词开始，根据所述拼接关系，依次获取拼接关系中所标记的在前分词，直到句子结束。本发明还公开一种中文分词装置。上述方法或装置降低了分词的复杂度。
中文分词方法装置

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 10021 条