专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果50个,建议您升级VIP下载更多相关专利
  • [发明专利]对包含多个文档的源数据进行聚类的装置和方法-CN201410532606.X在审
  • 郑仲光;孟遥;孙俊 - 富士通株式会社
  • 2014-10-10 - 2016-05-11 - G06F17/30
  • 本公开涉及对包含多个文档的源数据进行聚类的装置和方法。根据本公开的对包含多个文档的源数据进行聚类的装置包括:设置单元,其设置聚类数的集合;聚类单元,其针对设置单元设置的集合中的每一个聚类数,使用文档中的词作为特征对源数据进行聚类,以将源数据聚类成数目等于聚类数的簇;划分单元,其针对聚类单元聚类的每一个簇,使用文档中的主题作为特征对簇执行划分过程;合并单元,其对划分单元划分后的簇执行合并过程;计数单元,其对合并单元合并后的簇进行计数,以获得更新聚类数;以及聚类数确定单元,其对计数单元获得的相同的更新聚类数进行计数,并且将数目最多的更新聚类数确定为最佳聚类数,并选择最优的聚类结果。
  • 包含文档数据进行装置方法
  • [发明专利]信息处理装置和通过外码输入目标语言文字的方法-CN201410213325.8在审
  • 方瑞玉;付亦雯;郑仲光;葛乃晟;孟遥;宋昕 - 富士通株式会社
  • 2014-05-20 - 2015-11-25 - G06F3/023
  • 公开了一种信息处理装置和通过外码输入目标语言文字的方法。从最近输入的目标语言文字中获得目标语句序列,针对目标语句序列中的每个目标语句,在源语言的源语句序列中识别一个对应源语句子序列。每个所述目标语句是相应源语句子序列的每个源语句的译文的可能性较大,且目标语句序列中相邻目标语句的对应源语句子序列在源语句序列中的相互距离较小。每个源语句子序列包含尽可能多的可能性较大的连续源语句。估计源语句序列中的可能当前源语句,其包括在覆盖所有源语句子序列的最小区间之外但与区间接近的至少一个语句。在假设当前正在输入或将要输入可能当前语句的目标语言的译文的情况下,减少输入的外码的歧义。
  • 信息处理装置通过输入目标语言文字方法
  • [发明专利]信息处理方法及装置-CN201310611314.0在审
  • 葛乃晟;郑仲光;付亦雯;孟遥 - 富士通株式会社
  • 2013-11-26 - 2015-06-03 - G06F17/30
  • 本申请提供一种信息处理方法和装置,该方法包括:按照预定语法单位,将搜索请求中的关键词针对预定的数据库中的文档进行最大名词单元匹配和/或语法关系匹配,根据所述最大名词单元匹配和/或语法关系匹配的匹配结果确定所述文档与所述搜索请求的相关度;其中,所述文档中的每一个预定语法单位都具有以最大名词单元为中心的语法关系;根据各文档与所述搜索请求的相关度获取作为搜索结果的文档。本申请中,当使用关键词在数据库中搜索文档时,可以根据在文档中搜索到的关键词与文档中的最大名词单元的匹配结果和/或与文档中的语法关系的匹配结果选择文档,从而可以搜索得到与搜索请求的相关度高的文档。
  • 信息处理方法装置
  • [发明专利]识别音译名的方法及装置-CN201310575092.1在审
  • 宋双永;郑仲光;孟遥 - 富士通株式会社
  • 2013-11-15 - 2015-05-27 - G06F17/27
  • 本发明提供一种识别音译名的方法和装置。该方法包括:对于当前语言的字符串,获取源语言的与所述字符串对应的至少一种发音单元序列;确定所述至少一种发音单元序列为所述源语言中的名称的概率;根据所述至少一种发音单元序列为所述源语言中的名称的概率判断所述当前语言的字符串是否为音译名。本发明中,对于当前语言的字符串,根据其对应的源语言的发音单元序列为源语言中的名称的概率判断当前语言的字符串是否为源语言音译名,能够准确识别出当前语言的字符串是否为源语言音译名。
  • 识别音译方法装置
  • [发明专利]生成单语解析模型的方法和装置以及语言转换装置-CN201310491909.7有效
  • 付亦雯;郑仲光;葛乃晟;孟遥;孙俊 - 富士通株式会社
  • 2013-10-18 - 2015-04-29 - G06F17/28
  • 本发明涉及一种生成单语解析模型的方法和装置以及语言转换装置。生成单语解析模型的方法包括:按照双语平行语料中的以目标语言撰写的目标语句的语序来调整双语平行语料中的以源语言撰写的源语句的语序;按照以下助词在目标语句中的位置将该助词插入调整了语序的源语句中以得到作为参考的中间语句,其中,在目标语句中存在该助词而在源语句中没有与该助词对应的助词;根据目标语言和源语言的双语平行语料,利用源语句与目标语句之间的空对齐信息以预定策略生成用于调整源语句的语序的候选结构表示;根据作为参考的中间语句从所生成的候选结构表示中选择用于生成单语解析模型的结构表示;以及对所选择的结构表示进行建模以生成单语解析模型。
  • 生成解析模型方法装置以及语言转换
  • [发明专利]无歧义日本人名列表构建方法、人名识别方法及装置-CN201310412289.3在审
  • 宋双永;孟遥;郑仲光;于浩 - 富士通株式会社
  • 2013-09-11 - 2015-03-18 - G06F17/30
  • 本发明公开了无歧义日本人名列表构建方法、人名识别方法及装置。构建列表的方法包括:利用日本姓氏列表对日本常见人名列表进行姓名分离以得到日本名字列表;将带有日本人名相关标记的训练语料划分为日本人名相关词语集合和其他词语集合;将所述日本人名相关词语集合与所述日本常见人名列表、日本姓氏列表和从日本常见人名列表进行姓名分离而得到日本名字列表合并为日本人名相关词语总集合;针对日本人名相关词语总集合中的每一个日本人名相关词语判断该词语是否为无歧义日本人名相关词语以建立无歧义日本人名相关词语列表。利用该列表进行分词和人名角色标注,能够提高中文分词的整体准确率、整体的人名角色标注性能以及最终的人名识别结果。
  • 歧义日本人名列表构建方法识别装置
  • [发明专利]带反馈的功能模块组合方法和装置、数据处理方法和设备-CN201310170904.4在审
  • 房璐;郑仲光;孟遥;于浩 - 富士通株式会社
  • 2013-05-10 - 2014-11-12 - G06F17/27
  • 公开了一种带有反馈控制的功能模块组合方法和装置以及数据处理方法和设备。该带有反馈控制的功能模块组合方法可以包括:领域本体库构建步骤,对于特定领域中存在的所有功能模块,根据各个功能模块的输入和输出来构建关于该特定领域的领域本体库;功能模块封装步骤,基于所构建的领域本体库对功能模块进行封装,以使得封装后的功能模块具有能够相互组合的格式;功能模块组合步骤,基于所构建的领域本体库,根据功能模块的输入和输出之间的关系,从封装后的功能模块中选择能够相互组合的两个或更多个功能模块并将所选择的两个或更多个功能模块组合在一起以供用于执行预定处理,其中,两个或更多个功能模块中的至少两个功能模块之间存在反馈控制。
  • 反馈功能模块组合方法装置数据处理设备
  • [发明专利]校正语料中的成语错误的装置和方法-CN201210520870.2有效
  • 郑仲光;周小佩;孟遥;于浩 - 富士通株式会社
  • 2012-12-06 - 2014-06-11 - G06F17/27
  • 本申请公开了一种校正语料中的成语错误的装置和方法,该装置包括:变形成语检测单元,检测语料中成语的变形;第一判断单元,判断成语的变形是否存在于近义词词典或易混淆词词典中;语义相似确定单元,在确定成语的变形不在近义词词典和易混淆词词典中时,确定其与原成语之间的语义是否相似;第二判断单元,在确定成语的变形与原成语之间的语义不相似时,确定其不正确,否则确定其正确;语音相似度计算单元,在确定成语的变形不正确的情况下,计算成语的变形与原成语之间的语音相似度;字形相似度计算单元,在确定成语的变形不正确的情况下,计算其与原成语之间的字形相似度;以及校正单元,在确定成语的变形不正确的情况下,校正成语的变形。
  • 校正语料中的成语错误装置方法
  • [发明专利]机器翻译方法和机器翻译系统-CN201210320544.7无效
  • 李贤华;郑仲光;付亦雯;孟遥;于浩 - 富士通株式会社
  • 2012-08-31 - 2014-03-26 - G06F17/28
  • 本发明公开了一种机器翻译方法和机器翻译系统。所述机器翻译方法包括:利用多个机器翻译设备,分别将源语言的原文翻译为目标语言,以得到多个候选译文;利用语言模型,针对多个候选译文分别计算语言模型得分;分别获得多个机器翻译设备给出的关于多个候选译文的设备得分;基于原文的长度和候选译文的长度,针对多个候选译文分别计算长度得分;基于语言模型得分、设备得分、长度得分的至少一个,分别计算多个候选译文的总得分;以及选择总得分最高的候选译文作为机器翻译的结果。
  • 机器翻译方法系统
  • [发明专利]识别具有组合型歧义的歧义词的方法和装置-CN201210211767.X无效
  • 郑仲光;孟遥;于浩 - 富士通株式会社
  • 2012-06-21 - 2014-01-15 - G06F17/27
  • 本发明公开了一种识别具有组合型歧义的歧义词的方法和装置。该方法包括:利用核心词表对第一语言句子进行粗粒度切分;利用核心词表在粗粒度切分后的分词结果中检测能够被分解成更小粒度的多个词的候选歧义词;通过分解候选歧义词对第一语言句子进行细粒度切分;从与第一语言句子对应的第二语言句子中分别抽取候选歧义词的译文、和候选歧义词所分解成的更小粒度的多个词的译文;以及判断所抽取的候选歧义词和更小粒度的多个词的译文是否出现在通过第一语言与第二语言词典得到的候选歧义词和更小粒度的多个词的译文中,以确定候选歧义词是真歧义词还是伪歧义词。
  • 识别具有组合歧义方法装置
  • [发明专利]基于层次短语模型的译文词序概率确定方法及装置-CN201110379623.0有效
  • 郑仲光;孟遥;于浩 - 富士通株式会社
  • 2011-11-16 - 2013-05-22 - G06F17/28
  • 本发明实施例公开了一种基于层次短语模型的译文词序概率确定方法及装置。该方法包括:确定源语句的候选翻译模式;针对每一候选翻译模式提取用于表征词序概率的特征量;根据预先获得的模型训练结果确定所述特征量的词序概率;根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。本发明实施例通过在候选翻译模式中提取表征词序概率的特征量,进而确定源语句的译文词序概率,增加对调序过程的控制,提高了翻译模式选择的正确性,减少了调序错误的出现,由此改善了将源语句转换为目标语言数据处理过程的性能。
  • 基于层次短语模型译文词序概率确定方法装置
  • [发明专利]源语言改写处理方法和设备及机器翻译系统-CN201110305010.2无效
  • 张洁;葛乃晟;郑仲光;孟遥;于浩 - 富士通株式会社
  • 2011-09-27 - 2013-04-03 - G06F17/28
  • 本发明提供了一种源语言改写处理方法和设备及机器翻译系统。该改写处理方法包括:对源语言语句中的待处理语句进行语法分析;根据语法分析结果确定待处理语句中的包含子句嵌套结构的语句;基于语法分析结果对所确定的包含子句嵌套结构的语句进行重构,以获得至少一个包含非嵌套子句的语句;以及用所获得的至少一个包含非嵌套子句的语句中的、含有最多非嵌套子句的语句来替换上述包含子句嵌套结构的语句。该处理装置被配置实现上述处理方法中包括的功能。应用本发明的处理方法、设备或系统,能够将一些复合长句降解并重组为若干非复合的子句,降低机器翻译过程中的翻译难度,提高翻译精度和翻译效率。本发明适用于自然语言处理领域。
  • 语言改写处理方法设备机器翻译系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top