专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果348274个,建议您升级VIP下载更多相关专利
  • [发明专利]一种基于视觉感应的AI语音应答响应系统-CN201910804779.5有效
  • 邹珺;熊阿伟 - 南昌保莱科技有限公司
  • 2019-08-28 - 2022-04-08 - G10L15/22
  • 本发明涉及一种基于视觉感应的AI语音应答响应系统,包括语音输出设备,语音输入设备,语音转换设备,语音响应设备;人数视觉感应设备,电话视觉感应设备,嘴型视觉感应设备,耳塞视觉感应设备,监控设备;用户通过语音输入设备输入语音语音转换设备对输入的语音进行模拟信号和数字信号的转换,语音响应设备进行判断是否是特定语音,是特定语音则进行语音响应,通过语音输出设备进行AI对话模式;不是特定语音则为其他语音响应;则启动监控设备,这时就要根据嘴型视觉感应设备,电话视觉感应设备,人数视觉感应设备产生的信息来判断是否响应,只有当三者都判断为是时,通过语音输出设备进行AI对话模式。
  • 一种基于视觉感应ai语音应答响应系统
  • [发明专利]一种语音识别方法、装置、设备及存储介质-CN202310641371.7在审
  • 茆廷志;万根顺;邢秀萍;张景宣;高建清;潘嘉;刘聪;胡国平 - 科大讯飞股份有限公司
  • 2023-05-31 - 2023-09-15 - G10L15/22
  • 本发明提供了一种语音识别方法、装置、设备及存储介质,语音识别方法包括:获取目标语音和目标视频,其中,目标语音为目标视频的视频内容的解说语音;对目标语音提取声学特征,得到目标语音的声学特征,并对目标视频提取含视频内容信息的视觉特征,得到目标视频的视觉特征;根据目标语音的声学特征并辅以目标视频的视觉特征,确定目标语音语音识别结果。考虑到目标语音为目标视频的视频内容的解说语音,其与目标视频的视频内容具有一定的相关性,本发明对目标视频提取含视频内容信息的视觉特征,辅以视觉特征对解说语音进行语音识别,在对目标语音即解说语音进行语音识别时,辅以含视频内容信息的视觉特征,能够获得较为准确的语音识别结果。
  • 一种语音识别方法装置设备存储介质
  • [发明专利]一种基于面部与语音识别的游戏控制系统及方法-CN201710283467.5在审
  • 张冰心 - 合肥充盈信息科技有限公司
  • 2017-04-26 - 2017-09-08 - G06F3/01
  • 本发明公开一种基于面部与语音识别的游戏控制系统及方法,该系统包括视觉采集模块、视觉识别模块、视觉对比模块、语音采集模块、语音识别模块、语音对比模块、数据库、数据处理模块、游戏控制模块、多媒体展示模块和语音播放模块;所述视觉采集模块通过视觉识别模块与视觉对比模块连接,所述语音采集模块通过语音识别模块与语音对比模块连接,所述视觉对比模块和语音对比模块分别通过数据处理模块与游戏控制模块连接,游戏控制模块分别与多媒体展示模块和语音播放模块连接本发明中游戏玩家可通过面部表情及语音对游戏中的人物进行控制,简化了游戏的操作,降低对环境的要求及对眼睛的伤害,同时增加了游戏的趣味性。
  • 一种基于面部语音识别游戏控制系统方法
  • [发明专利]语音与图像同步性的衡量方法及装置-CN202111057976.9在审
  • 王淳;曾定衡;王洪斌;吴海英;周迅溢;蒋宁 - 马上消费金融股份有限公司
  • 2021-09-09 - 2022-05-10 - H04N17/00
  • 本申请提供一种语音与图像同步性的衡量方法及装置,该方法包括:获取视频中的语音片段和图像片段,语音片段与图像片段在视频中具有对应关系;根据图像片段生成目标人物的轮廓图,轮廓图与目标人物的个体特征无关;通过语音神经网络获得语音片段的语音特征;通过视觉神经网络获得轮廓图的视觉特征;根据语音特征与视觉特征,确定语音片段与图像片段是否具有同步性。在将图像片段输入视觉神经网络之前,通过先对图像片段进行处理,去除图像片段中与人物个体相关的特征,再将对图像片段处理后得到的图像数据输入视觉神经网络。这样,通过视觉神经网络获取的视觉特征就不再携带有说话人自身的特征,进而能够提高语音与图像同步性衡量的准确性。
  • 语音图像同步衡量方法装置
  • [发明专利]语音活性检测方法和装置-CN202010607791.X在审
  • 邓建凯;甘津瑞;张顺;吴卫 - 苏州思必驰信息科技有限公司
  • 2020-06-29 - 2020-10-09 - G10L15/22
  • 本发明公开一种语音活性检测方法和装置,其中,语音活性检测方法,包括:响应于检测到用户的第一语音,缓存所述第一语音;响应于接收到视觉检测模型的开始消息,向语音识别系统发送缓存的所述第一语音,其中,所述视觉检测模型在检测到所述用户的嘴巴张开时发送开始消息;实时采集所述用户后续的第二语音并持续将所述第二语音发送给所述语音识别系统直至接收到所述视觉检测模型的结束消息,其中,所述视觉检测模型在检测到所述用户的嘴巴闭合之后发送所述结束消息,通过语音视觉融合从而实现了精准断句与精确区分多用户说话的场景下的多用户区分
  • 语音活性检测方法装置
  • [发明专利]一种充分利用视觉语音联系的视听语音增强方法及系统-CN202110716972.0在审
  • 李腾;王晓龙;王妍 - 安徽大学
  • 2021-06-28 - 2021-10-01 - G10L21/02
  • 一种充分利用视觉语音联系的视听语音增强方法及系统,属于语音信号处理技术领域,解决如何利用视觉语音之间的内在联系,在现实中嘈杂的语音环境中实现对目标语音信息进行增强的问题;在语音特征和视觉特征融合之前,通过BLSTM对视觉特征进行初次利用,由此得到的目标的二进制掩码和原始的噪声幅度谱图获取的语音特征相融合从而得到干净幅度二进制掩码,将此幅度掩码代替基本框架中的视觉特征和语音特征一起馈入BLSTM和全连接层组成的训练网络;同时在基础的增强网络之上,基于频域,加入后置相位子网络,利用语音的幅度和相位在结构上相关性,获取增强相位谱图和幅度谱图相融合使得语音增强效果更佳,提高了增强后语音清晰度,降低语音失真率。
  • 一种充分利用视觉语音联系视听增强方法系统
  • [实用新型]一种图书获得语音的系统-CN201120529302.X有效
  • 刘森 - 东莞市永正电子图书科技有限公司
  • 2011-12-17 - 2012-09-12 - G09B5/04
  • 一种图书获得语音的系统,涉及电子感应定位、语音播放技术。包括图书、语音卡及定位发声设备,所述语音卡存储有与图书中视觉相对应的语音信息,所述定位发声设备将图书中任一位置的视觉信息与语音卡中该视觉信息对应的语音信息进行对应,在触笔点击图书的某一位置后,能够将相应位置的内容以语音形式播放有益效果在于:只要点击图书中的视觉信息,系统就能准确地播放出其所对应的语音,从而具有很好的互动性。使用极其简单,尤其适宜儿童学习娱乐使用,使其更快地领会图书中的内容。
  • 一种图书获得语音系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top