[发明专利]商品标题文本翻译方法及其装置、设备与介质在审
| 申请号: | 202111108721.0 | 申请日: | 2021-09-22 |
| 公开(公告)号: | CN113836950A | 公开(公告)日: | 2021-12-24 |
| 发明(设计)人: | 庞磊;钟裕滨 | 申请(专利权)人: | 广州华多网络科技有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30;G06F40/295 |
| 代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
| 地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 商品 标题 文本 翻译 方法 及其 装置 设备 介质 | ||
1.一种商品标题文本翻译方法,其特征在于,包括如下步骤:
从商品标题文本的词向量中分别提取语义特征和位置特征,获得相应的词嵌入向量和词位置向量,所述词向量的每个元素对应所述商品标题文本中的一个分词;
获取所述词向量相对应的词性向量,所述词性向量用于指示所述词向量中各个分词相对应的词性,所述词性向量中与各分词相对应的编码根据预设词典查询确定,将相对于该预设词典而发现的新词标注为特有编码;
将所述词位置向量与所述词性向量相融合为词性对齐向量;
将所述词嵌入向量与所述词性对齐向量融合为所述商品标题文本的编码特征向量;
根据所述编码特征向量进行机器翻译获得所述商品标题文本的目标语种表达式,该目标语种表达式保留与所述特有编码相对应的分词的原文。
2.根据权利要求1所述的方法,其特征在于,本方法包括如下后置步骤:
根据所述特有编码相对应的分词获取与其相对应的目标语种的词表达式;
将所述目标语种表达式中的所述原文对应替换为所述词表达式获得所述商品标题文本的目标语种标题文本。
3.根据权利要求1所述的方法,其特征在于,从商品标题文本的词向量中分别提取语义特征和位置特征,获得相应的词嵌入向量和词位置向量的步骤,包括:
根据预设的位置编码算法,将所述词向量转换为用于表征各分词在所述商品标题文本中相对位置的词位置向量;
对所述词向量进行语义特征提取,生成用于表征各分词在所述商品标题文本中相应的上下文语义特征的所述词嵌入向量。
4.根据权利要求1所述的方法,其特征在于,获取所述词向量相对应的词性向量的步骤,包括:
将所述词向量输入至词性标注模型中;
所述词性标注模型基于所述预设词典中储存的多个电商分词进行查询,将所述词向量中与任意所述电商分词相对应的分词作为旧词以标注为普通编码,将不与任意所述电商分词相对应的分词作为新词以标注为所述特有编码;
将该些分词的编码组合成所述词向量的编码序列;
将所述编码序列转换为向量长度与所述词位置向量及词嵌入向量相等的所述词性向量。
5.根据权利要求4所述的方法,其特征在于,所述词性标注模型基于HMM模型所实现。
6.根据权利要求1所述的方法,其特征在于,将所述词位置向量与所述词性向量相融合为词性对齐向量的步骤,包括:
将所述词位置向量与词性向量输入至池化融合模型中;
所述池化融合模型提取所述词位置向量所表征的各分词在所述商品标题文本中的位置特征,以及提取词组特征向量所表征的分词的词性特征;
将所述位置特征及词性特征进行融合,获取所述词性对齐向量,所述词性对齐向量与所述词位置向量与词性向量的向量长度相同。
7.根据权利要求1至6任意一项所述的方法,其特征在于,本方法包括如下后置步骤:
根据所述特有编码相对应的分词,确定所述商品标题文本所对应的品牌标签,以对该商品标题文本所对应的电商商品进行品牌归类。
8.一种电子设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任一项所述的方法的步骤。
9.一种非易失性存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111108721.0/1.html,转载请声明来源钻瓜专利网。





