[发明专利]一种基于语音识别的农产品信息采集方法和系统在审
申请号: | 201611038064.6 | 申请日: | 2016-11-23 |
公开(公告)号: | CN106356054A | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 李才平 | 申请(专利权)人: | 广西大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14;G10L15/18;G10L15/26;H04L29/08 |
代理公司: | 深圳市兴科达知识产权代理有限公司44260 | 代理人: | 袁士林 |
地址: | 530004 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及农产品信息采集技术领域,公开一种基于语音识别的农产品信息采集方法和系统。一种农业语音信息识别的方法,该方法包括模型训练阶段和识别阶段。模型训练阶段包括声学模型训练和语言模型训练两部分。一种基于语音识别的农产品信息采集系统,包括移动终端、移动互联网、语音云计算平台;语音云计算平台包括语音服务器、业务服务器、授权服务器;语音服务器提供自动语音识别服务和语音合成服务。系统在云计算平台搭建识别引擎,并训练出稳定的声学模型,通过手持式移动终端采集语音信号,通过互联网发送到服务器端进行识别,词识别率达到95%以上,满足了农产品语音信息采集的需要,工作效率高。 | ||
搜索关键词: | 一种 基于 语音 识别 农产品 信息 采集 方法 系统 | ||
【主权项】:
一种农业语音信息识别的方法,该方法包括模型训练阶段和识别阶段;所述模型训练阶段包括声学模型训练和语言模型训练两部分;所述声学模型的建模单元为上下文三音子;所述声学模型训练的步骤是:第一步,对声音信号进行预处理;第二步,提取稳定的声学特征;第三步,通过人工采集大量的语音样本建立语音语料库;最后一步,采用向前向后算法进行模型的训练,得到稳定的声学模型;所述语言模型的训练的步骤是:第一步,对特定的应用场景用文本提取工具提取大量的文本,第二步,建立语料库,并对其语义分析和语法结构进行推断,进而形成语言模型;所述识别阶段的步骤是:第一步,在前端对输入语音信号进行特征提取,得到的特征向量与声学模型进行声学对比;第二步,从发音词典中选出概率分布最为接近的候选词,再利用语言模型进一步进行约束,得到最终的农业信息文本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611038064.6/,转载请声明来源钻瓜专利网。