[发明专利]基于唇语识别的重度听障患者言语理解度的改进方法在审
申请号: | 202011346536.0 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112330713A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 唐闺臣;王沛;梁瑞宇;王青云;李克;邹采荣;谢跃;包永强 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06T7/207 | 分类号: | G06T7/207;G06N3/04;G06N3/08 |
代理公司: | 南京睿之博知识产权代理有限公司 32296 | 代理人: | 刘菊兰 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于唇语识别的重度听障患者言语理解度的改进方法,包括:使用图像采集设备从现实环境中采集唇部运动图像序列,作为深度神经网络的输入特征;构建基于深度学习的视觉模态语音端点检测方法,在低信噪比条件下确认语音段位置;构建基于三维卷积‑残差网络‑双向GRU结构的深度学习模型作为基线模型;在基线模型的基础上构建基于时空信息特征的唇语识别模型;利用交叉熵损失训练网络模型,根据训练后的唇语识别模型识别出说话内容。本发明通过时空信息反馈来捕捉唇语图像的细粒度特征和时域关键帧,从而提高对复杂环境中唇语特征的适应性,提高唇语识别性能,改善了重度听障患者的语言理解能力,具有良好的应用前景。 | ||
搜索关键词: | 基于 识别 重度 患者 言语 理解 改进 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011346536.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种高度可调的钢琴
- 下一篇:一种便于使用的新型钢琴