|
钻瓜专利网为您找到相关结果 50个,建议您 升级VIP下载更多相关专利
- [发明专利]对包含多个文档的源数据进行聚类的装置和方法-CN201410532606.X在审
-
郑仲光;孟遥;孙俊
-
富士通株式会社
-
2014-10-10
-
2016-05-11
-
G06F17/30
- 本公开涉及对包含多个文档的源数据进行聚类的装置和方法。根据本公开的对包含多个文档的源数据进行聚类的装置包括:设置单元,其设置聚类数的集合;聚类单元,其针对设置单元设置的集合中的每一个聚类数,使用文档中的词作为特征对源数据进行聚类,以将源数据聚类成数目等于聚类数的簇;划分单元,其针对聚类单元聚类的每一个簇,使用文档中的主题作为特征对簇执行划分过程;合并单元,其对划分单元划分后的簇执行合并过程;计数单元,其对合并单元合并后的簇进行计数,以获得更新聚类数;以及聚类数确定单元,其对计数单元获得的相同的更新聚类数进行计数,并且将数目最多的更新聚类数确定为最佳聚类数,并选择最优的聚类结果。
- 包含文档数据进行装置方法
- [发明专利]信息处理方法及装置-CN201310611314.0在审
-
葛乃晟;郑仲光;付亦雯;孟遥
-
富士通株式会社
-
2013-11-26
-
2015-06-03
-
G06F17/30
- 本申请提供一种信息处理方法和装置,该方法包括:按照预定语法单位,将搜索请求中的关键词针对预定的数据库中的文档进行最大名词单元匹配和/或语法关系匹配,根据所述最大名词单元匹配和/或语法关系匹配的匹配结果确定所述文档与所述搜索请求的相关度;其中,所述文档中的每一个预定语法单位都具有以最大名词单元为中心的语法关系;根据各文档与所述搜索请求的相关度获取作为搜索结果的文档。本申请中,当使用关键词在数据库中搜索文档时,可以根据在文档中搜索到的关键词与文档中的最大名词单元的匹配结果和/或与文档中的语法关系的匹配结果选择文档,从而可以搜索得到与搜索请求的相关度高的文档。
- 信息处理方法装置
- [发明专利]校正语料中的成语错误的装置和方法-CN201210520870.2有效
-
郑仲光;周小佩;孟遥;于浩
-
富士通株式会社
-
2012-12-06
-
2014-06-11
-
G06F17/27
- 本申请公开了一种校正语料中的成语错误的装置和方法,该装置包括:变形成语检测单元,检测语料中成语的变形;第一判断单元,判断成语的变形是否存在于近义词词典或易混淆词词典中;语义相似确定单元,在确定成语的变形不在近义词词典和易混淆词词典中时,确定其与原成语之间的语义是否相似;第二判断单元,在确定成语的变形与原成语之间的语义不相似时,确定其不正确,否则确定其正确;语音相似度计算单元,在确定成语的变形不正确的情况下,计算成语的变形与原成语之间的语音相似度;字形相似度计算单元,在确定成语的变形不正确的情况下,计算其与原成语之间的字形相似度;以及校正单元,在确定成语的变形不正确的情况下,校正成语的变形。
- 校正语料中的成语错误装置方法
|