[发明专利]一种通过眼动追踪来协助瘫痪失语者语言输出的系统在审

申请号：	202110893020.6	申请日：	2021-08-04
公开（公告）号：	CN113627312A	公开（公告）日：	2021-11-09
发明（设计）人：	陈祥雨;肖明慧;陈美华	申请（专利权）人：	东南大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06F3/01;G06F40/166;G06F40/242;G10L13/08;G10L15/22;G10L15/25
代理公司：	北京同辉知识产权代理事务所(普通合伙) 11357	代理人：	刘慧
地址：	210024 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种通过追踪协助瘫痪失语语言输出系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种通过眼动追踪来协助瘫痪失语者语言输出的系统，其特征在于，包括硬件部分、软件部分；

硬件部分包括：外部识别摄像头：用于拍摄外部环境；

头戴式透镜眼镜显示器：半透明设计，用户透过显示器看到周围环境；

视频输出接口：将头戴式透镜眼镜显示器中显示的内容，实时输出到外部视频播放设备；

眼动仪：追踪用户眼镜焦点，完成互动操作；

以及麦克风、扬声器；

软件部分包括：词典联想组句模块：显示备选的词语或语句；

声音文本互转模块：将语言类和非语言类声音转换为文本；

图像识别模块：将图像识别为文本；

词典存储模块：存储用户按时间顺序注视过的和输出的“物品组+文本组”记录；

眼动词语编辑模块：对用户注视的词语显示编辑功能菜单。

2.根据权利要求1所述的一种通过眼动追踪来协助瘫痪失语者语言输出的系统，其特征在于，所述系统包含前台学习模式：用于用户主动的向系统进行外部环境相关语言的输入；

后台学习模式：用于系统在后台识别与学习用户的语音和注视过的物品，用户无需确认操作；

词典训练分析模式：用于系统对词典存储模块中的图像和文本进行模型训练，最终获得的模型为：当向模型输入某图像或词语时，模型输出所对应的最相关的文本；

正常使用模式：系统通过用户视线停留的物品，自动生成可选的文本，用户选择确认后，文本通过声音文本互转模块生成语音，并通过扬声器播放；

紧急使用模式：系统中设有特殊预置文本词典，供用户在紧急情况下使用。

3.根据权利要求2所述的一种通过眼动追踪来协助瘫痪失语者语言输出的系统，其特征在于，所述前台学习模式的具体流程如下：

(1)外部识别摄像头开启，将视频信号传递给图像识别模块，图像识别模块识别视场中的物品；

(2)眼动仪跟踪用户视线，确定用户视线停留过的物品；

(3)用户说话，进行语音输出；

(4)系统开始计时；

(5)麦克风收集用户上述语音，并将语音数据传递给声音文本互转模块；

(6)声音文本互转模块将上述语音转换成备选文本选项；

(7)头戴式透镜眼镜显示器高亮显示用户视线停留的物品，图像识别模块将此物品转换为备选文本选项并显示在物品旁边；

(8)眼动仪记录用户眼动切换注视物品的时刻；

(9)用户语音输出结束；

(10)系统停止计时；

(11)头戴式透镜眼镜显示器显示上述备选文本选项、和眼动仪确定的用户视线停留过的物品截图，文本选项按眼动时刻进行文本分隔，并按用户语音输出和视线停留的时刻顺序进行排列；在计时时间段内，第n时刻的文本和第n时刻眼动仪确定的用户视线停留的物品一同高亮显示，文本分割为词语，并标注词性；

(12)用户通过眼动词语编辑模块编辑上述分隔显示的词语；

(13)头戴式透镜眼镜显示器提示用户进行确认；

(14)用户通过眼动仪注视提示来进行确认；

(15)用户确认后，上述文本选项和一组物品截图，按照上述时刻顺序，作为一条“物品组+文本组”记录，存储到词典存储模块；

(16)回到并重复步骤(2)-(15)，继续向系统的词典存储模块输入更多的“物品组+文本组”记录；

(17)结束前台学习模式。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110893020.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载