[发明专利]语言模型的构建方法和装置在审
申请号: | 201610423002.0 | 申请日: | 2016-06-14 |
公开(公告)号: | CN107506345A | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 方昕;刘俊华;吴明辉;魏思;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张大威 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语言 模型 构建 方法 装置 | ||
1.一种语言模型的构建方法,其特征在于,包括:
确定建模单元;
获取所述建模单元的词向量,以及除所述词向量之外的其他特征向量;
根据所述词向量和所述其他特征向量,生成所述建模单元对应的语言模型。
2.根据权利要求1所述的方法,其特征在于,当所述建模单元为多个时,所述方法还包括:
采用所述多个语言模型中的一个或者至少两个计算得到语言模型得分。
3.根据权利要求2所述的方法,其特征在于,当采用至少两个语言模型计算得到语言模型得分时,所述语言模型得分是根据所述至少两个语言模型中的每个语言模型对应的得分进行插值运算后得到的。
4.根据权利要求1-3任一项所述的方法,其特征在于,当所述语言模型是黏着语语言模型时,所述建模单元和对应的其他特征向量包括:
当所述建模单元是整词时,所述其他特征向量是所述整词包括的词干对应的词干词性向量;或者,
当所述建模单元是子词时,所述其他特征向量是所述子词对应的子词属性向量;或者,
当所述建模单元是词干时,所述其他特征向量是所述词干对应的词干词性向量。
5.根据权利要求4所述的方法,其特征在于,获取所述其他特征向量,包括:
根据对词干的词性标注信息和/或对词缀的构型属性标注信息,获取所述其他特征向量。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述词向量和所述其他特征向量,生成所述建模单元对应的语言模型,包括:
根据所述词向量和所述其他特征向量,通过如下项中的任一项的训练方式,生成对应的语言模型:
RNN、CNN、DNN、N-gram。
7.一种语言模型的构建装置,其特征在于,包括:
确定模块,用于确定建模单元;
获取模块,用于获取所述建模单元的词向量,以及除所述词向量之外的其他特征向量;
生成模块,用于根据所述词向量和所述其他特征向量,生成所述建模单元对应的语言模型。
8.根据权利要求7所述的装置,其特征在于,当所述建模单元为多个时,所述装置还包括:
计算模块,用于采用所述多个语言模型中的一个或者至少两个计算得到语言模型得分。
9.根据权利要求8所述的装置,其特征在于,当采用至少两个语言模型计算得到语言模型得分时,所述计算模块得到的所述语言模型得分是根据所述至少两个语言模型中的每个语言模型对应的得分进行插值运算后得到的。
10.根据权利要求7-9任一项所述的装置,其特征在于,当所述语言模型是黏着语语言模型时,所述建模单元和对应的其他特征向量包括:
当所述建模单元是整词时,所述其他特征向量是所述整词包括的词干对应的词干词性向量;或者,
当所述建模单元是子词时,所述其他特征向量是所述子词对应的子词属性向量;或者,
当所述建模单元是词干时,所述其他特征向量是所述词干对应的词干词性向量。
11.根据权利要求10所述的装置,其特征在于,所述获取模块用于获取所述其他特征向量,包括:
根据对词干的词性标注信息和/或对词缀的构型属性标注信息,获取所述其他特征向量。
12.根据权利要求7-9任一项所述的装置,其特征在于,所述生成模块具体用于:
根据所述词向量和所述其他特征向量,通过如下项中的任一项的训练方式,生成对应的语言模型:
RNN、CNN、DNN、N-gram。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610423002.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能射击训练系统
- 下一篇:一种旋转式抗爆传送装置