|
钻瓜专利网为您找到相关结果 10021个,建议您 升级VIP下载更多相关专利
- [发明专利]分词方法和分词系统-CN201610251640.9有效
-
陈炳标
-
广东万丈金数信息技术股份有限公司
-
2016-04-20
-
2018-10-26
-
G06F17/27
- 本发明公开了一种分词方法和分词系统,所述方法包括:接收输入的待测文本;根据预设划分标识对待测文本进行划分;根据预先建立的字典分别对各个新文本进行正向最大匹配分词和反向最大匹配分词;比较两次匹配后的分词结果是否相同;当比较结果相同时,输出任意一个匹配后的分词结果;当比较结果不同时,根据所述字典分别计算两次匹配后的分词结果中各个词的词频;判断两次匹配后的分词结果中各个词的词频是否符合第一要求;当判定不符合时,根据所述字典分别判断两次匹配后的分词结果的语法是否正确;当判定正向匹配分词结果的语法正确时,输出正向匹配分词结果,否则输出反向匹配分词结果。本发明提高分词速度和准确率,满足实际应用需要。
- 分词方法系统
- [发明专利]分词方法和装置-CN201910164080.7有效
-
焦伟;陈孝良;冯大航;常乐
-
北京声智科技有限公司
-
2019-03-05
-
2023-04-18
-
G06F40/289
- 本申请公开了一种分词方法和装置,通过获取待分词文本;根据前向字典树,对待分词文本进行前向最大匹配分词,得到前向分词结果;根据后向字典树,对待分词文本进行后向最大匹配分词,得到后向分词结果;判断前向分词结果的词数与后向分词结果的词数是否相同;若前向分词结果的词数与后向分词结果的词数相同,则将前向分词结果作为待分词文本的分词结果;若前向分词结果的词数与后向分词结果的词数不相同,则将词数较少的分词结果作为所述待分词文本的分词结果。本申请由于采用了字典树进行分词,分词的速度得到了提高。并且通过采用前向最大匹配分词和后向最大匹配分词,提高了分词的准确率。
- 分词方法装置
- [发明专利]用于搜索引擎的分词处理方法和装置-CN201110378434.1无效
-
李理
-
北京趣拿信息技术有限公司
-
2011-11-24
-
2012-04-04
-
G06F17/27
- 本发明提供一种用于搜索引擎的分词处理方法和装置,该用于搜索引擎的分词处理方法,包括:获取用户输入的目标分词语句;根据预先存储的分词词典对目标分词语句进行分词;在确认出现分词歧义字段时,调用预先建立的分词统计模型,并选择分词歧义字段在所述分词统计模型中具有最高概率的分词方式进行分词。装置包括:第一获取模块,用于获取用户输入的目标分词语句;第一分词模块,用于根据预先存储的分词词典对目标分词语句进行分词;第二分词模块,用于在确认出现分词歧义字段时,调用预先建立的分词统计模型,并选择所述分词歧义字段在所述分词统计模型中具有最高概率的分词方式进行分词
- 用于搜索引擎分词处理方法装置
- [发明专利]一种公式抄袭检测方法及系统-CN201610021492.1有效
-
夏峰
-
夏峰
-
2016-01-13
-
2018-03-16
-
G06F17/27
- 其中,对比库,收录素材;分词库,收录分词及对应词性;所述分词库进一步包含公式库;分词模块进行分词;分词特征值生成模块生成分词词性特征值;分词自由向量维数确定模块确定分词自由向量维数;分词精简向量维数生成模块,生成分词精简向量维数;分词特征向量生成模块,生成分词特征向量;待鉴定文档分词模块用于对待鉴定文档进行分词,得到分词结果;待鉴定文档分词自由向量维数确定模块,确定分词自由向量维数;待鉴定文档分词精简向量维数生成模块,生成待鉴定文档分词精简向量维数;待鉴定文档分词特征向量生成模块,生成待鉴定文档分词特征向量;进行相似度比对。
- 一种公式抄袭检测方法系统
- [发明专利]一种网络查重方法及系统-CN201610019274.4有效
-
夏峰;洪学文;曾文斌
-
湖南通远网络科技有限公司
-
2016-01-13
-
2018-05-22
-
G06F17/27
- 其中,对比库,收录素材;分词库,收录分词及对应词性;分词模块进行分词;分词特征值生成模块生成分词词性特征值;分词自由向量维数确定模块确定分词自由向量维数;分词精简向量维数生成模块,生成分词精简向量维数;分词特征向量生成模块,生成分词特征向量;待鉴定文档分词模块用于对待鉴定文档进行分词,得到分词结果;待鉴定文档分词自由向量维数确定模块,确定分词自由向量维数;待鉴定文档分词精简向量维数生成模块,生成待鉴定文档分词精简向量维数;待鉴定文档分词特征向量生成模块,生成待鉴定文档分词特征向量;进行相似度比对。
- 一种网络方法系统
- [发明专利]一种文献联合检测方法及系统-CN201610020489.8有效
-
夏峰
-
夏峰
-
2016-01-13
-
2018-04-13
-
G06F17/22
- 其中,对比库,收录素材;分词库,收录分词及对应词性;分词模块进行分词;分词特征值生成模块生成分词词性特征值;分词自由向量维数确定模块确定分词自由向量维数;分词精简向量维数生成模块,生成分词精简向量维数;分词特征向量生成模块,生成分词特征向量;待鉴定文档分词模块用于对待鉴定文档进行分词,得到分词结果;待鉴定文档分词自由向量维数确定模块,确定分词自由向量维数;待鉴定文档分词精简向量维数生成模块,生成待鉴定文档分词精简向量维数;待鉴定文档分词特征向量生成模块,生成待鉴定文档分词特征向量;进行相似度比对。
- 一种文献联合检测方法系统
- [发明专利]中文分词方法及装置-CN200710102082.0无效
-
王启明
-
腾讯科技(深圳)有限公司
-
2007-05-14
-
2007-11-14
-
G06F17/28
- 本发明公开了一种中文分词方法,包括:为分词集合中的分词赋权值,所述分词集合中的分词按照分词在句子中的位置排序;从所述分词集合的最后一个分词开始,记录当前分词的权值与其在前分词到句尾的距离的和,作为当前分词到句尾的距离,标记该在前分词与当前分词的拼接关系,直到得到分词集合中第一个分词到句尾的距离,及所述第一个分词与其在前分词的拼接关系;从所述分词集合的第一个分词开始,选择所述到句尾的距离最短的句首分词,所述句首分词的第一个字为所述句子的第一个字;从所述句首分词开始,根据所述拼接关系,依次获取拼接关系中所标记的在前分词,直到句子结束。本发明还公开一种中文分词装置。上述方法或装置降低了分词的复杂度。
- 中文分词方法装置
|