[发明专利]基于车联网的专项语音识别方法有效
申请号: | 201610534313.4 | 申请日: | 2016-07-08 |
公开(公告)号: | CN106202045B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 谢欣霖;陈波 | 申请(专利权)人: | 成都之达科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 杨春 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于车联网的专项语音识别方法,该方法包括:利用机器学习方法对训练语料进行学习从而建立分词器;对专有名词进行分类;利用条件随机场进行词类标记,由车载系统的语义推测分类模块进行语义推测。本发明提出了一种基于车联网的专项语音识别方法,不需要离线字典中的标记训练样本集,对规则的依赖性小,提高了识别精度,适应车载系统不断更新的需求。 | ||
搜索关键词: | 基于 联网 专项 语音 识别 方法 | ||
【主权项】:
1.一种基于车联网的专项语音识别方法,其特征在于,包括:车载系统的识别模块利用机器学习方法对训练语料进行学习从而建立分词器;对专有名词进行分类,首先获取数据库的训练样本集与测试集;在对训练样本集进行预处理以及文本表示的基础上对训练样本集进行训练,获得一个分类器;对测试集进行测试,在对训练样本进行预处理之后,得到分词,将每个专有名词转化成由词素组成的向量;利用训练样本统计各个词素的词频与逆向频率,并由此计算每个词素相对于预先定义的分类的正则化词频与逆向频率之比,将其作为该专有名词相对于相应分类的权值;分别计算待处理的专有名词相对于各个分类的权值之和,给出最终的分类结果;利用条件随机场进行词类标记,然后由车载系统的语义推测分类模块进行语义推测;所述数据库中将每条语音命令设置四项内容,分别是意向、语音命令原文、语音命令的分词信息、语音命令的词类标记信息;生成分词的训练文件、分词的测试文件、词类标记的训练文件、词类标记的测试文件,在分词与词类标记过程中,将发现的重复性错误添加到程序自定义的词典中批量的进行修改;利用分词训练文件进行条件随机场的学习训练,获得一个分词系统,利用词类标记训练文件进行条件随机场的学习训练,获得一个词类标记系统,用分词测试文件进行测试,获取分词的精度;对词类标记测试文件进行测试,获取词类标记系统的精度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都之达科技有限公司,未经成都之达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610534313.4/,转载请声明来源钻瓜专利网。