[发明专利]一种基于图像分析的幼儿智能语音教育的方法有效
申请号: | 201610871506.9 | 申请日: | 2016-09-29 |
公开(公告)号: | CN106409290B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/22;G06F16/53;G06N5/02;G06N5/04;G06Q50/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明中提出的一种基于图像分析的幼儿智能语音教育的方法,其主要内容包括:训练数据库和智能教育流程,其过程为,采用幼儿认知教育图片形成素材库,结合知识库形成问题与解决系统。当语音输入问题时,利用长短期记忆模型递归神经网络的语音识别方法进行语音识别。采用VQA模型,包括引导反向传播技术和闭塞模型进行语义分析和图像分析。然后在问题与解决系统中查询知识信息,通过多层感知分类器获得最高概率答案并返回答案,最后语音输出答案并以文字显示。本发明能自动分析语音输入获得用户问题信息,进行自动推理生成问题答案,进行智能语音教育。使用方便,操作快捷,减少了家长和老师的机械性劳动;增加了趣味性,提高幼儿的学习效率。 | ||
搜索关键词: | 一种 基于 图像 分析 幼儿 智能 语音 教育 方法 | ||
【主权项】:
1.一种基于图像分析的幼儿智能语音教育的方法,其特征在于,主要包括:(一)训练数据库;(二)语音问题输入;(三)对语义分析与图像分析结果进行处理,具体包括如下步骤:采用VQA模型,视其为一个学习函数a=fw(i,q),输入图像i和图像问题q,由fw进行参数化,并产生答案a,为了衡量分量i和q的重要性,对应的即图像中的像素点的重要性以及图像问题的关键词的重要性,在每个测试点itest,qtest周围进行最佳线性近似值,
其中,f(i,q)表示近似值的结果,
为对矢量做偏导,
表示最佳线性匹配,计算关键在于
和
即函数对图片和问题的每个输入进行偏导数,这些表达式表面上看类似于梯度计算的反向传播神经网络的训练,然而,有两个关键的差异:计算的是预测输出的概率偏导数,不是真实的输出;计算相对于输入的偏导数,即图像和嵌入词汇的像素强度,没有参数;(四)在问题与解决系统中查询知识信息,具体包括如下步骤:采用多层感知分类器预测概率,VQA模型采用基于图像嵌入的卷积神经网络与基于问题嵌入的长短期记忆相结合,并采用了多层感知器作为分类器来预测答案概率分布;返回答案和语音输出答案并以文字显示是通过分类器获得的最高概率答案并返回,结果以语音输出和文字显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610871506.9/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序