“郑仲光”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果50个，建议您升级VIP下载更多相关专利

[发明专利]对包含多个文档的源数据进行聚类的装置和方法-CN201410532606.X在审
发明人： 郑仲光;孟遥;孙俊 -专利权人：富士通株式会社
申请日： 2014-10-10 - 公布日： 2016-05-11 - 主分类号： G06F17/30 文献下载
摘要：本公开涉及对包含多个文档的源数据进行聚类的装置和方法。根据本公开的对包含多个文档的源数据进行聚类的装置包括：设置单元，其设置聚类数的集合；聚类单元，其针对设置单元设置的集合中的每一个聚类数，使用文档中的词作为特征对源数据进行聚类，以将源数据聚类成数目等于聚类数的簇；划分单元，其针对聚类单元聚类的每一个簇，使用文档中的主题作为特征对簇执行划分过程；合并单元，其对划分单元划分后的簇执行合并过程；计数单元，其对合并单元合并后的簇进行计数，以获得更新聚类数；以及聚类数确定单元，其对计数单元获得的相同的更新聚类数进行计数，并且将数目最多的更新聚类数确定为最佳聚类数，并选择最优的聚类结果。
包含文档数据进行装置方法

[发明专利]信息处理装置和通过外码输入目标语言文字的方法-CN201410213325.8在审
发明人：方瑞玉;付亦雯;郑仲光;葛乃晟;孟遥;宋昕 -专利权人：富士通株式会社
申请日： 2014-05-20 - 公布日： 2015-11-25 - 主分类号： G06F3/023 文献下载
摘要：公开了一种信息处理装置和通过外码输入目标语言文字的方法。从最近输入的目标语言文字中获得目标语句序列，针对目标语句序列中的每个目标语句，在源语言的源语句序列中识别一个对应源语句子序列。每个所述目标语句是相应源语句子序列的每个源语句的译文的可能性较大，且目标语句序列中相邻目标语句的对应源语句子序列在源语句序列中的相互距离较小。每个源语句子序列包含尽可能多的可能性较大的连续源语句。估计源语句序列中的可能当前源语句，其包括在覆盖所有源语句子序列的最小区间之外但与区间接近的至少一个语句。在假设当前正在输入或将要输入可能当前语句的目标语言的译文的情况下，减少输入的外码的歧义。
信息处理装置通过输入目标语言文字方法

[发明专利]用户分类装置、用户分类方法以及电子设备-CN201410222082.4在审
发明人：葛乃晟;付奕雯;郑仲光;孟遥 -专利权人：富士通株式会社
申请日： 2014-05-23 - 公布日： 2015-11-25 - 主分类号： G06F17/30 文献下载
摘要：本公开提供一种用户分类装置、用户分类方法和电子设备。该用户分类装置用于针对预定领域的用户进行分类，包括：内容搜索单元，用于在预定数据源中搜索包含该预定领域的主题词的内容作为预定领域内容，并将发布该预定领域内容的用户作为待分类用户；以及用户分类单元，用于根据所述预定领域内容的、与用户相关的属性，对所述待分类用户进行分类。根据本公开的用户分类装置、用户分类方法和电子设备至少能够对预定领域的用户进行更精准的分类。
用户分类装置方法以及电子设备

[发明专利]基于多词单元进行辅助翻译的方法和装置-CN201410164469.9在审
发明人：付亦雯;郑仲光;方瑞玉;孟遥;孙俊;宋昕 -专利权人：富士通株式会社
申请日： 2014-04-22 - 公布日： 2015-11-25 - 主分类号： G06F17/28 文献下载
摘要：本发明涉及一种基于多词单元进行辅助翻译的方法和装置，该方法包括：获取用户输入的源语言音节或目标语言音节；获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元；将所述多词单元划分为多个短语，并从划分后的所述多词单元中提取出多个短语组合；利用预先建立的模型，至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率，计算所述多词单元的权值；根据所述多词单元的权值显示目标语言的多词单元。
基于单元进行辅助翻译方法装置

[发明专利]信息处理方法及装置-CN201310611314.0在审
发明人：葛乃晟;郑仲光;付亦雯;孟遥 -专利权人：富士通株式会社
申请日： 2013-11-26 - 公布日： 2015-06-03 - 主分类号： G06F17/30 文献下载
摘要：本申请提供一种信息处理方法和装置，该方法包括：按照预定语法单位，将搜索请求中的关键词针对预定的数据库中的文档进行最大名词单元匹配和/或语法关系匹配，根据所述最大名词单元匹配和/或语法关系匹配的匹配结果确定所述文档与所述搜索请求的相关度；其中，所述文档中的每一个预定语法单位都具有以最大名词单元为中心的语法关系；根据各文档与所述搜索请求的相关度获取作为搜索结果的文档。本申请中，当使用关键词在数据库中搜索文档时，可以根据在文档中搜索到的关键词与文档中的最大名词单元的匹配结果和/或与文档中的语法关系的匹配结果选择文档，从而可以搜索得到与搜索请求的相关度高的文档。
信息处理方法装置

[发明专利]识别音译名的方法及装置-CN201310575092.1在审
发明人：宋双永;郑仲光;孟遥 -专利权人：富士通株式会社
申请日： 2013-11-15 - 公布日： 2015-05-27 - 主分类号： G06F17/27 文献下载
摘要：本发明提供一种识别音译名的方法和装置。该方法包括：对于当前语言的字符串，获取源语言的与所述字符串对应的至少一种发音单元序列；确定所述至少一种发音单元序列为所述源语言中的名称的概率；根据所述至少一种发音单元序列为所述源语言中的名称的概率判断所述当前语言的字符串是否为音译名。本发明中，对于当前语言的字符串，根据其对应的源语言的发音单元序列为源语言中的名称的概率判断当前语言的字符串是否为源语言音译名，能够准确识别出当前语言的字符串是否为源语言音译名。
识别音译方法装置

[发明专利]生成单语解析模型的方法和装置以及语言转换装置-CN201310491909.7有效
发明人：付亦雯;郑仲光;葛乃晟;孟遥;孙俊 -专利权人：富士通株式会社
申请日： 2013-10-18 - 公布日： 2015-04-29 - 主分类号： G06F17/28 文献下载
摘要：本发明涉及一种生成单语解析模型的方法和装置以及语言转换装置。生成单语解析模型的方法包括：按照双语平行语料中的以目标语言撰写的目标语句的语序来调整双语平行语料中的以源语言撰写的源语句的语序；按照以下助词在目标语句中的位置将该助词插入调整了语序的源语句中以得到作为参考的中间语句，其中，在目标语句中存在该助词而在源语句中没有与该助词对应的助词；根据目标语言和源语言的双语平行语料，利用源语句与目标语句之间的空对齐信息以预定策略生成用于调整源语句的语序的候选结构表示；根据作为参考的中间语句从所生成的候选结构表示中选择用于生成单语解析模型的结构表示；以及对所选择的结构表示进行建模以生成单语解析模型。
生成解析模型方法装置以及语言转换

[发明专利]无歧义日本人名列表构建方法、人名识别方法及装置-CN201310412289.3在审
发明人：宋双永;孟遥;郑仲光;于浩 -专利权人：富士通株式会社
申请日： 2013-09-11 - 公布日： 2015-03-18 - 主分类号： G06F17/30 文献下载
摘要：本发明公开了无歧义日本人名列表构建方法、人名识别方法及装置。构建列表的方法包括：利用日本姓氏列表对日本常见人名列表进行姓名分离以得到日本名字列表；将带有日本人名相关标记的训练语料划分为日本人名相关词语集合和其他词语集合；将所述日本人名相关词语集合与所述日本常见人名列表、日本姓氏列表和从日本常见人名列表进行姓名分离而得到日本名字列表合并为日本人名相关词语总集合；针对日本人名相关词语总集合中的每一个日本人名相关词语判断该词语是否为无歧义日本人名相关词语以建立无歧义日本人名相关词语列表。利用该列表进行分词和人名角色标注，能够提高中文分词的整体准确率、整体的人名角色标注性能以及最终的人名识别结果。
歧义日本人名列表构建方法识别装置

[发明专利]带反馈的功能模块组合方法和装置、数据处理方法和设备-CN201310170904.4在审
发明人：房璐;郑仲光;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2013-05-10 - 公布日： 2014-11-12 - 主分类号： G06F17/27 文献下载
摘要：公开了一种带有反馈控制的功能模块组合方法和装置以及数据处理方法和设备。该带有反馈控制的功能模块组合方法可以包括：领域本体库构建步骤，对于特定领域中存在的所有功能模块，根据各个功能模块的输入和输出来构建关于该特定领域的领域本体库；功能模块封装步骤，基于所构建的领域本体库对功能模块进行封装，以使得封装后的功能模块具有能够相互组合的格式；功能模块组合步骤，基于所构建的领域本体库，根据功能模块的输入和输出之间的关系，从封装后的功能模块中选择能够相互组合的两个或更多个功能模块并将所选择的两个或更多个功能模块组合在一起以供用于执行预定处理，其中，两个或更多个功能模块中的至少两个功能模块之间存在反馈控制。
反馈功能模块组合方法装置数据处理设备

[发明专利]校正语料中的成语错误的装置和方法-CN201210520870.2有效
发明人： 郑仲光;周小佩;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2012-12-06 - 公布日： 2014-06-11 - 主分类号： G06F17/27 文献下载
摘要：本申请公开了一种校正语料中的成语错误的装置和方法，该装置包括：变形成语检测单元，检测语料中成语的变形；第一判断单元，判断成语的变形是否存在于近义词词典或易混淆词词典中；语义相似确定单元，在确定成语的变形不在近义词词典和易混淆词词典中时，确定其与原成语之间的语义是否相似；第二判断单元，在确定成语的变形与原成语之间的语义不相似时，确定其不正确，否则确定其正确；语音相似度计算单元，在确定成语的变形不正确的情况下，计算成语的变形与原成语之间的语音相似度；字形相似度计算单元，在确定成语的变形不正确的情况下，计算其与原成语之间的字形相似度；以及校正单元，在确定成语的变形不正确的情况下，校正成语的变形。
校正语料中的成语错误装置方法

[发明专利]机器翻译方法和机器翻译系统-CN201210320544.7无效
发明人：李贤华;郑仲光;付亦雯;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2012-08-31 - 公布日： 2014-03-26 - 主分类号： G06F17/28 文献下载
摘要：本发明公开了一种机器翻译方法和机器翻译系统。所述机器翻译方法包括：利用多个机器翻译设备，分别将源语言的原文翻译为目标语言，以得到多个候选译文；利用语言模型，针对多个候选译文分别计算语言模型得分；分别获得多个机器翻译设备给出的关于多个候选译文的设备得分；基于原文的长度和候选译文的长度，针对多个候选译文分别计算长度得分；基于语言模型得分、设备得分、长度得分的至少一个，分别计算多个候选译文的总得分；以及选择总得分最高的候选译文作为机器翻译的结果。
机器翻译方法系统

[发明专利]依存句法分析方法、装置及辅助分类器训练方法-CN201210226930.X在审
发明人： 郑仲光;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2012-06-29 - 公布日： 2014-01-15 - 主分类号： G06F17/27 文献下载
摘要：公开了依存句法分析方法、装置及辅助分类器训练方法。该依存句法分析方法包括初步分析步骤，使用通用的依存句法分析器对目标领域的句子进行依存句法分析，生成预定数量的分析结果；特征提取步骤，从作为所述分析结果的依存关系树中提取至少部分边的高阶特征；分类步骤，使用辅助分类器基于所述高阶特征对所述预定数量的分析结果进行分类，依据分类结果从所述预定数量的分析结果中选取最终的依存句法分析结果。
依存句法分析方法装置辅助分类训练

[发明专利]识别具有组合型歧义的歧义词的方法和装置-CN201210211767.X无效
发明人： 郑仲光;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2012-06-21 - 公布日： 2014-01-15 - 主分类号： G06F17/27 文献下载
摘要：本发明公开了一种识别具有组合型歧义的歧义词的方法和装置。该方法包括：利用核心词表对第一语言句子进行粗粒度切分；利用核心词表在粗粒度切分后的分词结果中检测能够被分解成更小粒度的多个词的候选歧义词；通过分解候选歧义词对第一语言句子进行细粒度切分；从与第一语言句子对应的第二语言句子中分别抽取候选歧义词的译文、和候选歧义词所分解成的更小粒度的多个词的译文；以及判断所抽取的候选歧义词和更小粒度的多个词的译文是否出现在通过第一语言与第二语言词典得到的候选歧义词和更小粒度的多个词的译文中，以确定候选歧义词是真歧义词还是伪歧义词。
识别具有组合歧义方法装置

[发明专利]基于层次短语模型的译文词序概率确定方法及装置-CN201110379623.0有效
发明人： 郑仲光;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2011-11-16 - 公布日： 2013-05-22 - 主分类号： G06F17/28 文献下载
摘要：本发明实施例公开了一种基于层次短语模型的译文词序概率确定方法及装置。该方法包括：确定源语句的候选翻译模式；针对每一候选翻译模式提取用于表征词序概率的特征量；根据预先获得的模型训练结果确定所述特征量的词序概率；根据所述特征量的词序概率，确定所述每一候选翻译模式的词序概率；根据所述候选翻译模式中词序概率的最大值，确定所述源语句的译文词序概率。本发明实施例通过在候选翻译模式中提取表征词序概率的特征量，进而确定源语句的译文词序概率，增加对调序过程的控制，提高了翻译模式选择的正确性，减少了调序错误的出现，由此改善了将源语句转换为目标语言数据处理过程的性能。
基于层次短语模型译文词序概率确定方法装置

[发明专利]源语言改写处理方法和设备及机器翻译系统-CN201110305010.2无效
发明人：张洁;葛乃晟;郑仲光;孟遥;于浩 -专利权人：富士通株式会社
申请日： 2011-09-27 - 公布日： 2013-04-03 - 主分类号： G06F17/28 文献下载
摘要：本发明提供了一种源语言改写处理方法和设备及机器翻译系统。该改写处理方法包括：对源语言语句中的待处理语句进行语法分析；根据语法分析结果确定待处理语句中的包含子句嵌套结构的语句；基于语法分析结果对所确定的包含子句嵌套结构的语句进行重构，以获得至少一个包含非嵌套子句的语句；以及用所获得的至少一个包含非嵌套子句的语句中的、含有最多非嵌套子句的语句来替换上述包含子句嵌套结构的语句。该处理装置被配置实现上述处理方法中包括的功能。应用本发明的处理方法、设备或系统，能够将一些复合长句降解并重组为若干非复合的子句，降低机器翻译过程中的翻译难度，提高翻译精度和翻译效率。本发明适用于自然语言处理领域。
语言改写处理方法设备机器翻译系统