[发明专利]一种结合中英知识资源的中文词语语义关系识别方法和装置有效

专利信息
申请号: 201710706832.9 申请日: 2017-08-17
公开(公告)号: CN107451130B 公开(公告)日: 2021-04-02
发明(设计)人: 鹿文鹏;孟凡擎;张玉腾 申请(专利权)人: 齐鲁工业大学
主分类号: G06F40/55 分类号: G06F40/55;G06F40/30;G06F40/284
代理公司: 暂无信息 代理人: 暂无信息
地址: 250353 山东省济南*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种结合中英知识资源的中文词语语义关系识别方法和装置。方法包括:结合多种中文知识资源获取反义词集合,根据反义词集合判定词语间语义关系是否具有反义关系;使用多种中文知识资源提取部分词集合,根据部分词集合判定词语间是否具有整体部分关系;利用多种中文知识资源提取同义词集合,基于同义词集合判定词语间是否具有同义关系;借助于多种中文知识资源提取下位词集合,根据下位词集合判定词语间是否具有上下位关系;使用汉英词典将中文词语对翻译转换为英文;利用英文知识资源对汉英转译所得英文词语对进行词语语义关系识别,以确定原中文词语对的语义关系。利用本发明,可以充分发挥多种中文知识资源的作用,更准确有效地识别中文词语语义关系。
搜索关键词: 一种 结合 知识 资源 中文 词语 语义 关系 识别 方法 装置
【主权项】:
一种结合中英知识资源的中文词语语义关系识别方法,其特征在于,该方法包括以下步骤:步骤一、结合多种中文知识资源获取反义词集合,根据反义词集合判定词语间语义关系是否具有反义关系;步骤二、使用多种中文知识资源提取部分词集合,根据部分词集合判定词语间是否具有整体部分关系;步骤三、利用多种中文知识资源提取同义词集合,基于同义词集合判定词语间是否具有同义关系;步骤四、借助于多种中文知识资源提取下位词集合,根据下位词集合判定词语间是否具有上下位关系;步骤五、使用汉英词典将中文词语对翻译转换为英文;步骤六、利用英文知识资源对步骤五所得英文词语对进行词语语义关系识别,以确定原中文词语对的语义关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710706832.9/,转载请声明来源钻瓜专利网。

同类专利
  • 翻译模型的确定方法和装置及存储介质-202310630832.0
  • 丁亮;昝畅通 - 北京京东振世信息技术有限公司
  • 2023-05-30 - 2023-08-29 - G06F40/55
  • 本公开提出一种翻译模型的确定方法和装置及存储介质,涉及计算机领域。本公开实施例将随机初始化翻译模型对齐到预训练翻译模型得到对齐后的随机初始化翻译模型,融合对齐后的随机初始化翻译模型和预训练翻译模型得到融合翻译模型,基于融合翻译模型进而得到最终翻译模型。从而,通过模型融合,有效结合预训练参数初始化与随机参数初始化两种方法训练出来翻译模型的优点,同时提高翻译模型的翻译效果和泛化性,缓解高资源场景的翻译任务中,预训练参数初始化训练的翻译模型翻译效果差、随机参数初始化训练的翻译模型泛化性较差的问题。
  • 术语替换方法及装置-201911303517.7
  • 张睦 - 语联网(武汉)信息技术有限公司
  • 2019-12-17 - 2023-08-25 - G06F40/55
  • 本发明实施例提供一种术语替换方法及装置,所述方法包括:获取原文句子、译文句子以及术语替换后的原文句子;将所述原文句子、译文句子以及术语替换后的原文句子输入至术语替换模型中,获得术语替换后的译文句子;其中,所述术语替换模型是根据由原文句子样本、所述原文句子样本对应的译文句子样本和术语替换后的原文句子样本所组成的输入样本以及所述输入样本对应的术语替换后的译文句子样本训练获得的。本发明实施例通过利用预先训练好的术语替换模型自动地生成术语替换后的译文句子,确保译文中的某个术语被替换掉时译文的语法正确同时减少译文句子结构的过多变化。
  • 语言翻译处理方法、装置、电子设备和介质-202010517699.4
  • 欧阳鹏;陈仁杰 - 广东小天才科技有限公司
  • 2020-06-09 - 2023-08-15 - G06F40/55
  • 本申请公开了一种语言翻译处理方法、装置、电子设备和介质。本申请中语言翻译处理方法包括:读取配置文件,所述配置文件包括待处理的语言集合配置信息;根据所述配置文件获取对应的翻译数据;按照所述待处理的语言集合配置信息,获取资源文件,确定所述资源文件中待处理的字符串;从所述翻译数据中获取所述待处理的字符串对应的翻译,生成翻译文件,并存储到对应语言的资源文件存放目录下,在进行多国语言开发的场景可以更快速、准确导入翻译词条到工程中,以及简化在翻译平台中新增翻译词条的步骤,减少人工操作。
  • 用于翻译集成服务优化方法、电子装置及储存介质-201911118234.5
  • 夏琮祺;刘日超 - 上海醍顶信息科技有限公司
  • 2019-11-15 - 2023-08-15 - G06F40/55
  • 本发明公开了一种用于翻译集成服务优化方法、电子装置及储存介质,包括包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的用于翻译集成服务优化的系统,所述用于翻译集成服务优化的系统被所述处理器执行时实现规范处理步骤、匹配优化步骤、引擎选择步骤、语境处理步骤和评价反馈步骤。本发明解决了现有技术中对不同语境中的词句翻译不准确,和不同翻译引擎翻译结果不同,以及无法正确处理用户不规范输入导致的翻译偏差、热门生造词、上下文语境处理不精确的问题。
  • 动态长文本国际化方法、装置、设备及存储介质-202211268587.5
  • 翁晓君;徐文豪;张凯;王弘毅 - 北京志凌海纳科技有限公司
  • 2022-10-17 - 2023-07-25 - G06F40/55
  • 本发明公开了一种动态长文本国际化方法,包括:构建国际化词条模块,获取动态模版文件转换为字符串,并按照预设规则映射至词条文件中;调用国际化模块进行词条获取,通过传递键值到全局的所述国际化模块来获取对应的翻译;监测到所述国际化模块,进入中间件模块处理,将原始参数透传至模版语言模块,读取已有的词条文件,调用模板引擎进行渲染,并触发编译能力;将helper函数注入所述模板引擎,增强所述模板引擎自身的处理能力,对所述模板语言进行处理,输入动态操作,返回渲染结果作为调用国际化模块的结果显示;基于模版语言自身的能力,自行处理动态的逻辑判断,并通过调用模版语言自身的渲染引擎来渲染,完成对动态文本的国际化处理。
  • 一种音节切分的方法、装置及存储介质-202211691525.5
  • 邓彪;翟飞飞;徐兆噗 - 北京中科凡语科技有限公司
  • 2022-12-27 - 2023-05-05 - G06F40/55
  • 本发明公开一种音节切分的方法、装置及存储介质,属于翻译技术领域。该音节切分的方法,包括以下步骤:S1、将单词进行音节切分,获得所有可能的音节切分候选;S2、根据发音规则,对每种音节切分候选进行打分,将得分最高的候选作为音节切分结果。本发明提出的音节切分的方法,能够实现对单词的音节切分,该方法的优点在于音节切分的快速且准确。
  • 文本替换方法、装置以及计算机可读存储介质-202111196752.6
  • 李旦;普伟;陈红凌;陈千举 - 腾讯科技(深圳)有限公司
  • 2021-10-14 - 2023-04-18 - G06F40/55
  • 本申请实施例公开了一种文本替换方法、装置以及计算机可读存储介质;可以基于预设的服务语言环境,从显示页面中读取待替换文本数据;对待替换文本数据进行节点识别,得到多个节点对象;对多个节点对象中符合预设节点尺寸规则的目标节点对象进行节点信息替换,得到第一文本;当检测到多个节点对象中包含不符合预设节点尺寸规则的待处理节点对象时,获取待处理节点对象对应的待处理数据,并将待处理数据中符合预设字符串匹配规则的目标数据进行字符替换,得到第二文本;将第一文本及第二文本进行融合,得到待替换文本数据对应的目标替换文本。以此,可有效提高匹配效率,且通过节点匹配及字符匹配相结合,提高文本替换的成功率和效率。
  • 用于社交交互的翻译和通信过滤器-202210974270.7
  • J.穆克尔;E.福图纳 - 索尼互动娱乐有限责任公司
  • 2022-08-15 - 2023-03-03 - G06F40/55
  • 提供了用于基于配置文件的语言翻译和过滤的系统和方法。可在存储器中为用户存储指定一个或多个翻译规则的用户语言配置文件。可监测与所述用户的用户装置相关联的当前通信会话。所述当前通信会话可包括来自一个或多个其他用户的一个或多个其他用户装置的消息。可实时检测到所述当前通信会话的所述消息中的至少一个消息中的语言集触发了所述翻译规则中的至少一个翻译规则。可基于所述至少一个翻译规则对所述至少一个消息中的所述语言集进行进一步实时过滤,从而可修改所述至少一个消息。此外,可修改提供给所述用户装置的所述当前通信会话的呈现以包括所述已修改的消息的所述已过滤的语言集而不是所述触发语言集。
  • 一种翻译方法、翻译系统和存储介质-202210330686.5
  • 李成;杨旭荣;张宝乾 - 深信服科技股份有限公司
  • 2022-03-30 - 2022-07-22 - G06F40/55
  • 本申请实施例公开了一种翻译方法,方法包括:若接收到客户端设备发送的用于请求翻译待显示内容为第一语言类型对应的内容的翻译请求,确定所述待显示内容包括的第二语言类型的参考字符对象;其中,所述服务端设备为所述客户端设备提供所述当前待显示内容对应的服务;若目标存储区域中存储有所述参考字符对象对应的目标字符对象,发送所述目标字符对象至网关设备,以使所述网关设备基于所述目标字符对象进行翻译处理;其中,所述目标字符对象是对所述参考字符对象进行序列化标识处理得到的。本申请实施例同时还公开了一种翻译系统和存储介质。
  • 对资源数据的有效存储和取回-202080059915.3
  • A·布鲁欣 - 微软技术许可有限责任公司
  • 2020-06-15 - 2022-04-08 - G06F40/55
  • 公开了一种用于压缩和解压缩本地化软件资源的方法和系统。所述方法可以包括:接收软件资源,所述软件资源采用第一语言;接收用于压缩的本地化软件资源,其中,采用所述第一语言的所述软件资源是采用第二语言的所述本地化软件资源的对应体。在接收到所述软件资源时,至少部分地基于所述软件资源中的一个或多个第一语言词语并且基于来自全局词典的数据来创建针对所述本地化软件资源的第一本地词典;以及基于所述本地词典来压缩所述本地化软件资源。
  • 电子邮件的翻译方法、装置和计算机设备-202010470528.0
  • 刘让琼;孟麟;周国强;谭悦伟 - 腾讯科技(深圳)有限公司
  • 2020-05-28 - 2021-12-03 - G06F40/55
  • 本申请涉及一种电子邮件的翻译方法、装置和计算机设备。该方法包括:响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本;通过分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据;解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。采用本方法能够简化用户的操作步骤。
  • 域名含义翻译方法-202110633746.6
  • 王郁佳;毛勇 - 浙江贰贰网络有限公司
  • 2021-06-07 - 2021-08-27 - G06F40/55
  • 本发明公开了一种域名含义翻译方法,其将由字母和/或数字组成的域名通过转换成便于理解中文域名含义,从而促达域名交易。一种域名含义翻译方法,包括建立词库的步骤;提取主体步骤,提取域名中主体名称中的字符;所述字符包括数字字符和/或字母字符;翻译步骤,将字符与词库中的词进行匹配,依据匹配的结果翻译出中文;反馈步骤,对翻译出的中文反馈给业务前端。
  • 负样本生成方法及装置-202110120449.1
  • 吴信东;单迎春;洪炎;卜晨阳 - 合肥工业大学
  • 2021-01-28 - 2021-05-28 - G06F40/55
  • 本发明公开了一种负样本生成方法及装置。其中,该方法包括:对知识图谱进行社区划分,得到多个社区;从多个实体中选择两个实体和两个实体之间的关系组成目标三元组;确定目标三元组所在的社区,并确定目标三元组所在社区的社区类型;依据社区类型,选择非目标三元组所在社区的实体或目标三元组所在社区的实体,对目标三元组样本中的实体进行替换,得到负样本。本发明解决了由于未考虑知识图谱的社区类型,导致生成的负样本质量不高的技术问题。
  • 语言处理方法及设备-201711411206.3
  • 邢超;陈晓;蔡振林 - 华为技术有限公司
  • 2017-12-23 - 2021-05-04 - G06F40/55
  • 一种语言处理方法及设备。所述方法包括:获取源语言和目标语言的n组互译句对,n组互译句对中的每一组互译句对包括互为译文的一个源语言句子和一个目标语言句子,n为大于1的整数;采用源语言的提取规则,从n组互译句对的每个源语言句子中提取源语言片段;从n组互译句对的每个目标语言句子中,分别提取与源语言片段互为译文的目标语言片段;根据从n个目标语言句子中提取的至少n个目标语言片段,生成目标语言的提取规则。本申请实施例提供的方案,通过根据已经确定的源语言的提取规则,能够自动生成目标语言的提取规则,不必通过语言专家总结目标语言的提取规则,节省了人力和时间成本。
  • 文本的翻译控制方法、装置、电子设备及存储介质-202110004889.0
  • 黄鑫;蒋庆高 - 安徽希施玛数据科技有限公司
  • 2021-01-04 - 2021-04-23 - G06F40/55
  • 本申请提供了一种文本的翻译控制方法、装置、电子设备及存储介质,其方法包括:识别出文本中待翻译字段所属的字段类型;根据所述字段类型,从预设的字段类型‑翻译规则映射关系表中获取与所述待翻译字段对应匹配的目标翻译规则;按照所述目标翻译规则对所述待翻译字段进行字段拆分、译文匹配以及译文重组处理,以获得所述待翻译字段对应匹配的译文。该方法通过对文本中的字段进行分类并针对不同的字段类型配置有对应的翻译规则,根据不同的字段类型选择不同的翻译规则进行自动翻译,效率高,且针对性强,有效提高翻译处理的准确性。
  • 一种结合中英知识资源的中文词语语义关系识别方法和装置-201710706832.9
  • 鹿文鹏;孟凡擎;张玉腾 - 齐鲁工业大学
  • 2017-08-17 - 2021-04-02 - G06F40/55
  • 本发明公开了一种结合中英知识资源的中文词语语义关系识别方法和装置。方法包括:结合多种中文知识资源获取反义词集合,根据反义词集合判定词语间语义关系是否具有反义关系;使用多种中文知识资源提取部分词集合,根据部分词集合判定词语间是否具有整体部分关系;利用多种中文知识资源提取同义词集合,基于同义词集合判定词语间是否具有同义关系;借助于多种中文知识资源提取下位词集合,根据下位词集合判定词语间是否具有上下位关系;使用汉英词典将中文词语对翻译转换为英文;利用英文知识资源对汉英转译所得英文词语对进行词语语义关系识别,以确定原中文词语对的语义关系。利用本发明,可以充分发挥多种中文知识资源的作用,更准确有效地识别中文词语语义关系。
  • 利用多种语言文本语音合成模型的语音翻译方法及系统-201980007947.6
  • 金泰洙;李泳槿 - 新智株式会社
  • 2019-01-11 - 2020-08-21 - G06F40/55
  • 本公开涉及利用多种语言文本语音合成模型的语音翻译方法、视频翻译方法以及系统。利用多种语言文本语音合成模型的语音翻译方法包括:获取以第一语言的学习文本、与第一语言的学习文本相对应的第一语言的学习语音数据、第二语言的学习文本以及与第二语言的学习文本相对应的第二语言的学习语音数据为基础进行学习的单一人工神经网络文本语音合成模型的步骤;接收第一语言的输入语音数据及与第一语言有关的说话人员的发声特征的步骤;将第一语言的输入语音数据转换成第一语言的文本的步骤;将第一语言的文本转换成第二语言的文本的步骤;以及通过向单一人工神经网络文本语音合成模型输入第二语言的文本及说话人员的发声特征来生成模仿说话人员的语音的与第二语言的文本有关的输出语音数据的步骤。
  • 替换代码中文字符串的方法以及计算机可读存储介质-201710353562.8
  • 陈立伟 - 网易(杭州)网络有限公司
  • 2017-05-18 - 2020-08-18 - G06F40/55
  • 替换代码中文字符串的方法以及计算机可读存储介质,该方法包括:根据代码的文法文件对代码进行词法分析与语法分析,提取出代码中的字符串并从中筛选出中文字符串;判断是否已存在代码的字符串数据文件,若是,则将筛选出的各中文字符串及其所述路径与已存在的字符串数据文件中的对应内容进行差异比较,根据比较结果更新所述字符串数据文件,以得到待翻译数据文件;若否,则导出各中文字符串及其所述路径,形成待翻译数据文件并进行翻译;读取翻译后的替换数据文件,以替换数据文件中的翻译结果替换对应路径下的中文字符串。计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时可实现前述方法的步骤。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top