[发明专利]语音采集系统在审
申请号: | 201711014821.0 | 申请日: | 2017-10-26 |
公开(公告)号: | CN109712640A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 王桂花 | 申请(专利权)人: | 王桂花 |
主分类号: | G10L21/10 | 分类号: | G10L21/10;G10L15/26;H04R27/00;G11B20/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 734502 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了语音采集系统,包括声音采集模块、第一功率放大器、第二功率放大器、提示模块,所述第一声音传感器的输出端与第一功率放大器的输入端单向电性连接,所述第二声音传感器的输出端与第二功率放大器的输入端单向电性连接,所述第一功率放大器和第二功率放大器的输出端均与提示模块的输入端单向电性连接。该语音采集系统通过声音采集模块、第一功率放大器、第二功率放大器、提示模块、第一语音识别芯片和第二语音识别芯片、第一LED显示屏和第二LED显示屏的配合,解决了现有语音采集系统无法避免外界环境的噪声给语音采集带来的影响,从而影响了医生与病人之间的正常沟通的问题。 | ||
搜索关键词: | 功率放大器 语音采集系统 电性连接 提示模块 输出端 输入端 声音采集模块 语音识别芯片 声音传感器 外界环境 语音采集 噪声 医生 配合 | ||
【主权项】:
1.语音采集系统,包括声音采集模块、第一功率放大器、第二功率放大器、提示模块,其特征在于:所述声音采集模块包括第一声音传感器和第二声音传感器,所述第一声音传感器的输出端与第一功率放大器的输入端单向电性连接,所述第二声音传感器的输出端与第二功率放大器的输入端单向电性连接,所述第一功率放大器和第二功率放大器的输出端均与提示模块的输入端单向电性连接;所述声音采集模块的输出端与语音识别模块的输入端单向电性连接,所述语音识别模块的输出端与显示模块的输入端单向电性连接,所述语音识别模块包括第一语音识别芯片和第二语音识别芯片,所述第一声音传感器的输出端与第一语音识别芯片的输入端单向电性连接,所述第二声音传感器的输出端与第二语音识别芯片的输入端单向电性连接,所述显示模块包括第一LED显示屏和第二LED显示屏,所述第一语音识别芯片的输出端与第一LED显示屏的输入端单向电性连接,所述第二语音识别芯片的输出端与第二LED显示屏的输入端单向电性连接。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王桂花,未经王桂花许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711014821.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 语音可视化测评方法、装置、设备及存储介质-201910554780.7
- 陈剑超;肖龙源;李稀敏;蔡振华;刘晓葳;谭玉坤 - 厦门快商通信息咨询有限公司
- 2019-06-25 - 2019-11-01 - G10L21/10
- 本申请公开了一种语音可视化测评方法、装置、设备及存储介质,确定用于评测的语音样本及其对应的可视化语音样本,记录用户阅读所述语音样本时的语流输出,对所述语流输出进行可视化,获得可视化后的语流输出,将所述可视化后的语流输出与所述可视化语音样本进行比较,将比较结果作为对所述用户的语音测评结果,从而通过对用户输出语音的音位特征和韵律特征进行可视化测评,测评结果一目了然,保障了测评的信度和效度。
- 一种基于全息图像的音频加密解密方法-201710015883.7
- 刘福平;王丽;符子瑞;卢志鹏;王宇坤;王安玲 - 北京印刷学院
- 2017-01-10 - 2019-10-08 - G10L21/10
- 本发明公开一种基于全息图像的音频加密解密方法。所述加密方法包括:从接收的一维音频信号中截取一段,将其转换成音频二维图像信号;将待嵌入的水印信息生成全息图信号,并将其嵌入到二维音频图像信号中;再利用SM4加密算法与置乱运算进行加密与置乱处理。根据保存的解密密钥,采取与加密方法相反的顺序进行解密运算,分离出一维音频信号和水印信息。本发明实现了音频信号的加密与全息信息隐藏并以图片形式传输,提高了音频信号传输的安全性;利用解密后恢复的水印中的文字、签字、照片等信息能够实现音频信息源的认证;利用全息技术的可撕毁性和高鲁棒性,能够从部分残缺音频信息图像信号中恢复完整的水印信息,提高了音频信息传输的鲁棒性。
- 维吾尔语音位-视位参数的转换方法和系统-201610675541.3
- 赵晖;刘学杰;秦添 - 新疆大学
- 2016-08-16 - 2019-07-02 - G10L21/10
- 本发明涉及一种维吾尔语音位‑视位参数的转换方法和系统,属于语音‑人脸动画信息处理技术领域。增加了41个特征和齿与舌的可见度特征,对元音口形数据聚类得到元音基本静态视位集。分别对辅音与不同元音相结合的口形数据聚类,得到了辅音基本静态视位集。并在此基础上,提出了复合视位的概念,建立了维吾尔语基本动态视位集。然后,给出了复合动态视位模型,以及基于线性回归算法的动态视位模型参数估计方法,从而实现了维吾尔语音位‑视位的转换。根据本发明的基本动态视位集及其模型参数,对于待转换的维吾尔语文本,进行文本分析后,得到文本所包含的基本动态视位序列,进而可以生成与文本内容一致的人脸唇部可视语音动画。
- 虚拟形象控制方法、虚拟形象控制装置和电子设备-201910252003.7
- 王云刚;徐子豪;周志颖;李政 - 广州虎牙信息科技有限公司
- 2019-03-29 - 2019-06-11 - G10L21/10
- 本申请提供的虚拟形象控制方法、虚拟形象控制装置和电子设备,涉及直播技术领域。详细地,本申请通过获取主播输入的语音信息;并对所述语音信息进行语音分析处理,得到对应的语音参数。然后,根据预设的参数转换算法将所述语音参数转换为控制参数,并根据该控制参数对所述虚拟形象的口型进行控制。通过上述方法,可以改善现有技术中对虚拟形象的控制存在精度较低的问题。
- 用于脖戴式语音交互耳机的音乐可视化装置-201711030511.8
- 朱华明;武巍 - 北京金锐德路科技有限公司
- 2017-10-27 - 2019-05-07 - G10L21/10
- 本发明提供了一种用于脖戴式语音交互耳机的音乐可视化装置,包括:收音装置、控制装置、屏幕和扬声器。该用于脖戴式语音交互耳机的音乐可视化装置,实现了听音乐或享受其他耳机服务时,屏幕显示预先设定的图案或视频,解决了现有耳机缺乏交互功能、无法展现用户个性的问题,提高了用户满意度。
- 语音采集系统-201711014821.0
- 王桂花 - 王桂花
- 2017-10-26 - 2019-05-03 - G10L21/10
- 本发明公开了语音采集系统,包括声音采集模块、第一功率放大器、第二功率放大器、提示模块,所述第一声音传感器的输出端与第一功率放大器的输入端单向电性连接,所述第二声音传感器的输出端与第二功率放大器的输入端单向电性连接,所述第一功率放大器和第二功率放大器的输出端均与提示模块的输入端单向电性连接。该语音采集系统通过声音采集模块、第一功率放大器、第二功率放大器、提示模块、第一语音识别芯片和第二语音识别芯片、第一LED显示屏和第二LED显示屏的配合,解决了现有语音采集系统无法避免外界环境的噪声给语音采集带来的影响,从而影响了医生与病人之间的正常沟通的问题。
- 基于神经网络的汉语声韵母可视化方法-201610121430.8
- 韩志艳;王健 - 渤海大学
- 2016-03-03 - 2019-03-26 - G10L21/10
- 基于神经网络的汉语声韵母可视化方法,步骤为:获取语音信号;对语音信号进行预处理;提取语音信号特征参数,进行PCA降维;设计并训练小波神经网络;小波神经网络输出的64个二进制编码依次对应显示屏上8×8个方格,其中前47个二进制编码及前47个二进制编码对应的方格依次对应按照发音特点排序的47个声韵母,当某个声韵母的语音信号综合特征向量输入小波神经网络时,小波神经网络的输出即为该声韵母的位置信息;将47个声韵母划分为12组,并分别将12组声韵母对应的方格的RGB赋不同的值,来获取颜色信息;合成上述位置信息和颜色信息,实现声韵母的可视化。该方法便于聋哑人记忆,具有良好的鲁棒性和易懂性,聋哑人可以准确辨识出可视化图像所对应的发音。
- 一种会议发言记录的生成方法及相关装置-201811202730.4
- 徐炜;刘丽 - 上海庆科信息技术有限公司
- 2018-10-16 - 2019-01-18 - G10L21/10
- 本申请所提供的一种会议发言记录的生成方法,包括:接收会议发言的语音数据包和设备身份数据;根据语音数据包进行语音转化得到文本数据;根据设备身份数据生成会议记录获取码,以便根据会议记录获取码获取文本数据。本申请无需与会人员手动记录会议记录,只需利用会议记录获取码即可获得会议记录的文本数据,大大减轻了与会人员的会议记录负担,提高了会议效果,为与会人员提供了极佳的会议体验感。本申请还提供一种会议发言记录的生成系统和一种计算机可读存储介质,具有上述有益效果。
- 生成音频的图形表示的方法和设备、音频搜索方法和设备-201310385132.6
- 廖勤樱;张世磊;刘文;钱伟红 - 国际商业机器公司
- 2013-08-29 - 2018-11-27 - G10L21/10
- 公开了一种生成音频内容的图形化表示的方法和设备。所述方法包括:获取有关音频内容中要图形化表示的对象的元数据;分析元数据以确定要图形化表示的对象之间的关联关系;从图形化表示元素的集合中选择分别与感兴趣的要图形化表示的对象以及关联关系对应的图形化表示元素;基于所选择的图形化表示元素,生成所述音频内容的图形化表示。通过所述方法和设备,用户能够快速了解音频的具体内容。还公开了在音频内容库中搜索音频内容的方法和设备,通过该方法和设备,用户能够了解特定话题的谈论历史,跟踪话题的演进。
- 一种动画内容的提供方法及装置-201310537461.8
- 周阳;孙璨 - 贵阳朗玛信息技术股份有限公司
- 2013-11-04 - 2018-10-12 - G10L21/10
- 本发明公开了一种动画内容的提供方法及装置,所述方法包括:生成音频内容的特征码;将所述特征码与预先保存的动作进行匹配,将匹配得到的动作生成动画。本发明将用户的音频内容转换为表现力更直观的动画,将动画提供给用户,能够为用户带来全新的娱乐体验。
- 一种交互式音乐可视化方法和装置-201510107553.1
- 张克俊;李思蒙;马知远;蒋宇帆;谢鑫;王堃;王洲浩 - 浙江大学
- 2015-03-11 - 2018-03-16 - G10L21/10
- 本发明公开了一种交互式音乐可视化方法,包括以下步骤(1)识别储存的音乐片段的情感特征(2)选择播放音乐片段;(3)根据播放的音乐片段控制矩阵布置的多个升降单元独立的上下运动;(4)根据参照物在三维空间内的位置变化调整所述控制信号,同时控制播放的音乐片段作与升降单元上下运动相适应的变化;本发明还公开了一种交互式音乐可视化装置,包括位置识别单元,主机,扬声器以及矩阵布置的多个升降单元;本发明将音乐以听觉、视觉以及触觉的“联觉”形式展现,将音乐通过实体的升降单元来形成三维的波浪起伏,并可以通过识别参照物移动来对音乐进行调整,降低音乐创作的门槛,释放音乐创造力,具有十分广阔的市场。
- 一种会话信息处理方法、装置、电子设备-201710555403.6
- 周琪 - 阿里巴巴集团控股有限公司
- 2017-07-10 - 2017-12-26 - G10L21/10
- 本说明书实施例公开了一种会话信息处理方法、装置、电子设备。所述方法包括可以获取待处理语音信息,识别所述待处理语音信息表达的情绪信息。然后可以根据包括所述情绪内容的信息内容调取相应的装饰配置信息,进而利用所述装饰配置信息对所述待处理语音信息的展示载体进行渲染,例如音频信息条,然后展示渲染后的音频信息条。
- 用于对连续语言进行可视化的系统和方法-201610380141.X
- N·A·卡尔博;M·卡尔博 - 国家阅读方式研究院公司
- 2016-06-01 - 2017-10-31 - G10L21/10
- 公开了用于对连续语音进行可视化的系统和方法。所述系统和方法包括接收朗读内容作为发音语音;分析所述发音,以确定在大声朗读时文本的发音气息串的特性和音长;以及基于所述发音气息串的特性和音长来产生要成为可视内容的起点和终点的高亮显示。
- 一种输入方法和终端-201710101628.4
- 苏净 - 深圳市金立通信设备有限公司
- 2017-02-23 - 2017-07-14 - G10L21/10
- 本发明实施例公开了一种输入方法及终端,其中方法包括获取用户输入的第一语音信息;将第一语音信息转换为对应的文字信息;将文字信息以预设的待确认的显示形式进行显示;若检测到用户触发语音纠正的请求,则获取用户输入的第二语音信息;根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字;使用替换文字替换待替换文字,并显示更新后的文字信息。本发明实施例通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新手动输入,可以提高在语音输入转化为文字后对错误文字的修改效率。
- 一种基于iOS平台的音频处理方法、系统及iOS设备-201510932611.4
- 张世芳;刘琳 - 卓望数码技术(深圳)有限公司
- 2015-12-15 - 2017-06-23 - G10L21/10
- 本发明提供了一种基于iOS平台的音频处理方法,所述方法包括设置录音采样参数;根据所述录音采样参数对音频进行采样以得到采样音频;根据所述采样音频进行UI绘制以得到UI层;将所述采样音频进行保存成数字音频文件;读取所述数字音频文件,并将所述数字音频文件转化成音频波形图;在所述UI层上通过剪辑控件对所述音频波形图进行截取以得到剪辑音频,并保存所述剪辑音频。本发明还提供了对应的系统及iOS设备。本发明通过将采样音频图形化,实现了在iOS设备中对音频进行录制和剪辑处理的功能,并在录制和剪辑处理的基础上可实现对剪辑音频进行添加特效功能。
- 一种声音动画的制作方法及电子设备-201510916059.X
- 武俊敏 - 掌赢信息科技(上海)有限公司
- 2015-12-10 - 2017-06-20 - G10L21/10
- 本发明公开了一种声音动画的制作方法及电子设备,该方法包括获取语音信息;将所述语音信息分割为多个语音片段;获取所述语音片段的特征;根据所述特征选取对应的嘴部表情;根据所述嘴部表情生成对应的表情帧;根据所述表情帧生成动画;该方法能够实时的通过语音来生成对应的表情动画,无需获取面部的视频信息,具有效率高、速度快、限制少、资源消耗少的优点。
- 音到拼音对应和音到文字对应的音的纠错方法-201611209506.9
- 陈勇 - 陈勇
- 2016-12-23 - 2017-06-13 - G10L21/10
- 本发明涉及软件领域,特别是涉及音到拼音对应和音到文字对应的音的纠错方法,修改方言到标准普通话的读音;自动生成的拼音正确了,生成的文字正确率就高多了。
- 一种视频聋哑模式的方法及装置-201611130832.0
- 张新亮 - 天脉聚源(北京)传媒科技有限公司
- 2016-12-09 - 2017-05-10 - G10L21/10
- 本发明公开了一种视频聋哑模式的方法及装置。所述视频聋哑模式的方法,包括实时监测正在播放中的视频的播放模式;当所述播放模式为聋哑模式时,实时获取视频中的语义信息;将所述视频中的语义信息翻译为手语信息;在所述视频中弹出手语信息框,在所述手语信息框内实时显示所述手语信息。本发明在开启聋哑模式之后,可实时的将视频中的语音信息翻译为手语信息,并在弹出的悬浮框内将手语信息以视频形式播放出来,为聋哑人士提供了便捷的手语信息服务,从而提高了聋哑人士的用户体验。
- 一种由手机屏幕操控的录音和文字转写装置-201621071410.6
- 虞焰兴 - 安徽声讯信息技术有限公司
- 2016-09-22 - 2017-04-19 - G10L21/10
- 本实用新型公开了一种由手机屏幕操控的录音和文字转写装置,包括壳体,所述壳体的顶端铰接有防护盖,所述防护盖靠近壳体的一侧设有第一凹槽和卡块,所述壳体的顶端设有显示屏和按键,所述显示屏的一侧设有第二凹槽,所述第二凹槽的内壁上铰接有连接杆,所述连接杆的一端安装有麦克风,所述第二凹槽远离显示屏的一侧设有卡槽,且卡槽与卡块相配合,所述壳体的两侧均设有散热口,所述壳体内设有主控板和通讯模块。本实用新型设计合理,方便学习者携带,智能化程度高,通过显示屏实时观察录音的进度和文字,方便学习者学习和阅览;保证了文字转化的可靠性和准确性,降低了同音字转化的错误,提高了学习的效率和质量。
- 会议记录装置及其自动生成会议记录的方法-201410839533.9
- 刘扬伟 - 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司
- 2014-12-30 - 2016-07-27 - G10L21/10
- 本发明提供一种会议记录装置及其自动生成会议记录的方法。其方法包括:根据一会议上接收的语音对应的语音信号以及所述存储器中存储的用户语音特征表,辨识出所述语音信号对应的一或多个用户;将所述语音信号转换为包含所述一或多个用户的用户名的文字;及根据转换得到的所述文字以及一会议记录模板生成一原始会议记录。本发明所述的会议记录装置及其自动生成会议记录的方法,可根据预设的会议记录模板自动生成会议记录,因而,相较于现有的方式更省时、方便及人性化。
- 会议记录装置及其自动生成会议记录的方法-201410839481.5
- 刘扬伟 - 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司
- 2014-12-30 - 2016-07-27 - G10L21/10
- 本发明提供一种会议记录装置及其自动生成会议记录的方法。其方法包括:将会议上的语音信号转换为文字;判断所述文字否包含一校正对象;在所述文字包含一校正对象时,根据一常用语数据库自动将所述文字包含的校正对象校正为对应的常用语;及根据校正后的所述文字以及所述会议记录模板生成一原始会议记录。本发明的会议记录装置及其自动生成会议记录的方法,可根据预设的会议记录模板自动生成会议记录,因而,相较于现有的方式更省时、方便及人性化。
- 一种基于映射关系的数据转换方法-201610003490.X
- 邱子皓 - 邱子皓
- 2016-01-04 - 2016-07-27 - G10L21/10
- 本申请涉及音频与图像之间的数据转换方法和系统。本申请提供了一种将音频转换成图像的方法包括:从音频中获取一个或多个特征值;确定所述一个或多个特征值与色彩集合的映射关系;基于所述映射关系获取色彩集合中的一个或多个色值;以及至少根据所述一个或多个色值生成图像。色卡中每个颜色色值有匹配的逻辑序列数值,因而可以匹配音乐音列音色所相应的连续数字序列。用绘画的视觉直观形式来表现音乐的听觉感官,从而实现图像和音乐之间的交互方式,图像和音乐之间的数据转换。本申请还提供了一种将图像转换成音频的方法和系统。
- 会议记录装置及其自动生成会议记录的方法-201410839876.5
- 刘扬伟 - 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司
- 2014-12-30 - 2016-07-27 - G10L21/10
- 本发明提供一种会议记录装置及其自动生成会议记录的方法。其方法包括:识别语音数据中的无声片段;判断所述无声片段所历经的时间是否大于一预设值;以历经的时间大于所述预设值的无声片段为界,将所述语音数据或所述语音数据转换得到的文字进行分割;及根据所述语音数据或所述文字被分割的情况以及一会议记录模板生成一原始会议记录。本发明的会议记录装置及其自动生成会议记录的方法,可根据预设的会议记录模板自动生成会议记录,因而,相较于现有的方式更省时、方便及人性化。
- 一种语义分析将语音转化为文字的方法及装置-201410621075.1
- 王飞 - 上海莱凯数码科技有限公司
- 2014-11-06 - 2016-06-01 - G10L21/10
- 一种语义分析将语音转换为文字的方法,其特征在于:包括语音接收模块、语义分析模块、语音元素识别模块、文字对应元素库和文字输出模块,所述的语音接收模块用于接收需要转换的语音;所述的语义分析模块对语音接收模块所接收的语音进行语义分析,从而识别所述语音中各个元素;所述的文字对应元素库包含所有文字的元素信息;所述的文字输出模块是用于输出并显示语音所对应的文字。本发明处理效率比较高,价格定位比较低,有更广泛的市场应用前景。
- 面向语音与面部表情信号的情感可视化方法-201510932789.9
- 韩志艳;王健;王东;尹作友;魏洪峰;郭兆正 - 渤海大学
- 2015-12-14 - 2016-05-04 - G10L21/10
- 本发明涉及一种面向语音与面部表情信号的多模式情感可视化方法,其主要包括:情感信号获取、情感信号预处理、情感特征参数提取、神经网络设计及图像生成。本发明首先对获取的情感信号进行特征提取,然后将获取的情感特征作为神经网络的输入,神经网络的输出即为相应的图案信息,然后通过图像生成模块生成可视化图像,实现对中性、高兴、愤怒、惊奇、悲伤和恐惧六种人类基本情感的可视化。该方法通过组合不同模式的情感特征进入一幅图像中,为人们创造了情感的可读模式,显示直观且具有高鲁棒性。
- 一种用于智能穿戴设备的系统-201510916425.1
- 潘昊;周丹 - 安徽海聚信息科技有限责任公司
- 2015-12-10 - 2016-04-27 - G10L21/10
- 本发明公开了一种用于智能穿戴设备的系统,包括采集单元、分析单元、控制单元、提醒单元。采集单元、分析单元、提醒单元均与控制单元连接,并通过无线信号进行通信。采集单元与分析单元之间通过滤波模块和模数转换模块连接。采集单元所采集的信息送至滤波模块进行滤波处理,经过滤波处理后的数据被送入模数转换模块,将连续的模拟信号转换为数字信号后送至分析单元进行分析处理。本发明与现有技术相比,具有结构合理、操作简便,能够完成对外部语音信号的拾取,并实现语音、文字互相转换,进而有效解决听力残缺人士日常交际障碍等显著的优点,方便了听力残疾人士的日常生活,还照顾到他们的体温健康,便于大范围推广使用。
- 发音显示装置及发音显示方法-201510096396.9
- 徐大威 - 株式会社东芝
- 2015-03-04 - 2015-09-23 - G10L21/10
- 本发明提供发音显示装置及发音显示方法。该发音显示装置具备转换部和作成部。转换部将声调语言即第2语言的每1个音节的音韵转换为表示第1语言的发音的多个第1发音符号。作成部按第2语言的每1个音节作成发音图解。发音图解具有第1直线和多个第1发音符号。第1直线是表示由第1发音符号表示的音的高低的边界的、在第1方向上较长的直线。多个第1发音符号配置在由第1直线分隔且在与第1方向垂直的第2方向上排列的多个区域内的、与音的高低相应的区域。
- 一种交互式音乐可视化装置-201520138998.1
- 李思蒙;马知远;张克俊;蒋宇帆;谢鑫;王堃;王洲浩 - 浙江大学
- 2015-03-11 - 2015-08-12 - G10L21/10
- 本实用新型公开了一种交互式音乐可视化装置,包括音乐触发单元和执行机构,所述执行机构包括安装平台,若干矩阵铺设在安装平台上的升降单元,带动升降单元形成起伏表面的驱动机构,所述驱动机构受控于音乐触发单元。本实用新型具有三维度的变化,在安装平台上形成起伏表面,变化形式丰富,将需要通过听觉感受的音乐转换成三维度变化的立体画面,与音乐结合,给人带来多变、丰富的听觉和视觉联合体验。
- 基于自动的单词翻译改变嘴唇形状的装置及方法-201380054426.9
- 金详哲 - 金详哲
- 2013-09-05 - 2015-07-01 - G10L21/10
- 公开了一种基于自动的单词翻译改变嘴唇形状的装置及方法。根据本发明的实施方式,本发明实现了当用户通过麦克风输入语音时通过使用摄像机拍摄用户的面部,使用户的嘴唇所在的区域与通过摄像机拍摄的图像区分;并且识别用户的语音,并且相对于与所识别的语音相对应的单词被翻译为其他语言时的情况,表示嘴唇形状的局部图像被插入到所区分的嘴唇所在的区域中,使得当用户通过语音输入的单词被翻译为其他语言时,能够自动地改变与单词相对应的嘴唇形状。
- 文字显示方法与处理装置以及计算机程序产品-201210216501.4
- 黄宇辰;林哲光 - 广达电脑股份有限公司
- 2012-06-27 - 2013-12-25 - G10L21/10
- 一种文字显示方法,包括:接收一语音信号;撷取该语音信号的基频轨迹;撷取该语音信号的能量轨迹;对该语音信号进行语音识别以识别出对应该语音信号的多个字并判断每个该等字的时间对齐信息;根据该能量轨迹、该基频轨迹以及该等时间对齐信息决定每个该等字的至少一文字显示参数;根据每个该等字的该至少一文字显示参数将该等字整合为一字句;以及输出该字句以使该字句显示于一显示装置。
- 专利分类