专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果182585个,建议您升级VIP下载更多相关专利
  • [发明专利]根据语音定义语意进行语音搜索的方法及系统-CN201611072257.3在审
  • 贺振增;王一丁;张鹏宇 - 暴风集团股份有限公司
  • 2016-11-29 - 2017-05-31 - G06F17/30
  • 本申请公开根据语音定义语意进行语音搜索的方法及系统,方法包括接收用户输入的语音信息,语音信息,包括中文和外语;在接收到用户输入的语音信息后,将语音信息与语音文字转换数据库中的内容进行比对,查找与语音信息相关的文字信息,并将用户输入的语音信息转换为文字信息;根据文字信息、预设的视频搜索维度和视频分类优先级,从视频数据库中搜索与文字信息相关的视频文件;判断是否搜索到与文字信息相关的视频文件,若搜索到与文字信息相关的视频文件,则将相应的视频文件推送给用户,若未搜索到与文字信息相关的视频文件,则提示用户搜索失败或重新输入语音信息进行搜索;根据用户输入的视频播放指令,对用户选择的视频进行播放。
  • 根据语音定义语意进行搜索方法系统
  • [发明专利]基于拼音约束联合学习的汉语语音识别方法-CN202010988154.1在审
  • 余正涛;梁仁凤;王振晗;朱俊国;高盛祥;毛存礼 - 昆明理工大学
  • 2020-09-18 - 2021-02-09 - G10L15/26
  • 本发明涉及基于拼音约束联合学习的汉语语音识别方法,属于自然语言处理技术领域。本发明首先从公开中文语料集中收集与语音、文本对应的拼音文本,其次通过共享编码器对语音特征编码,再以拼音语音识别为辅助任务,然后,在解码过程中利用拼音作为解码约束,基于共享编码器将拼音语音识别语汉语语音识别联合学习,引入一种更接近语音的归纳偏置,增强编码器对汉语语音的表达能力。本发明提出的基于拼音约束联合学习的汉语语音识别方法,对汉语的识别降低了词错率,为后续在汉语语音识别过程中融入拼音以及使用拼音纠错等工作提供强有力的支撑;缓解了端到端的模型对汉字的识别难以收敛的问题。
  • 基于拼音约束联合学习汉语语音识别方法
  • [发明专利]一种通过语音控制文段复制粘贴的方法及其装置-CN201410236920.3有效
  • 王以哲 - 宁夏宁信信息科技有限公司
  • 2014-06-26 - 2017-01-04 - G06F3/0487
  • 本发明涉及一种通过语音控制文段复制粘贴的方法及其装置,其中,所述方法包括:接收用户于所述触摸屏的按压操作;响应所述操作,检测所述触摸屏所处的当前界面是否满足文段选中条件;若满足,则将显示至少两个光标于所述触摸屏上,同时启动语音录入设备接收第一语音信息的输入;通过语音识别设备识别所述第一语音信息并根据所述第一语音信息控制所述光标进行移动选中文段;接收第二语音信息的输入;通过语音识别设备识别所述第二语音信息并根据所述第二语音信息控制所述光标关闭并将已选中的文段保存以作为用于复制或粘贴的内容
  • 一种通过语音控制复制粘贴方法及其装置
  • [发明专利]一种具有语音合成功能的广播系统-CN201811237798.6在审
  • 雷平 - 成都共同进步信息技术有限公司
  • 2018-10-23 - 2020-05-19 - G10L13/02
  • 本发明公开了一种具有语音合成功能的广播系统,包括语音合成芯片XFS5152、电压监控芯片IMP811REUS‑T、Cortex‑M3处理器STM32F103ZET6,所述的语音合成芯片XFS5152的主通讯端口RXD、TXD分别通过上拉电阻R13、R14与Cortex‑M3处理器STM32F103ZET6连接,所述的语音合成芯片XFS5152的其他控制端口分别通过上拉电阻R11、R12与处理器STM32F103ZET6本发明具有将文本通过数字的方式合成语音音频的功能,支持中文语音合成,语音音调、音速调整,支持标点符号停顿,支持常用的电话号码、日期时间等格式的停顿。
  • 一种具有语音合成功能广播系统
  • [发明专利]语音合成方法、装置、设备及存储介质-CN202011622887.X在审
  • 陈梦楠;江源;高丽;祖漪清 - 科大讯飞股份有限公司
  • 2020-12-31 - 2021-04-30 - G10L13/02
  • 本申请公开了一种语音合成方法、装置、设备及存储介质,本申请获取到原始文本、原始文本对应的音素序列,以及待合成语音的说话人特征,进而将原始文本以及音素序列进行特征融合,得到融合特征,进而基于融合特征及说话人特征进行编解码处理,得到声学频谱,并基于声学频谱进行语音合成,得到合成语音。本申请通过融合原始文本及音素序列得到融合特征,丰富了输入信息,并且能够挖掘不同语种特有的发音信息,示例如,中文的调型、日语的调核、俄语的重音等均可以通过音素序列得以展示,基于此得到声学频谱并进行语音合成,得到的合成语音更加自然、符合对应语种的发音特点,也即合成语音的质量更高。
  • 语音合成方法装置设备存储介质
  • [发明专利]一种语音数据分析方法及系统-CN202110262803.4在审
  • 刘刚;龚科 - 暗物智能科技(广州)有限公司
  • 2021-03-09 - 2022-09-27 - G10L15/02
  • 本发明提供了一种语音数据分析方法及系统,其中,该方法包括:获取待分析语音数据;从待分析语音数据中提取出不同语言类型对应的音频片段;基于不同语言类型对应的音频片段的时长,生成语音数据分析结果。从而通过对待分析语音数据中各个音频片段中语音的语言类型进行分析,并按照不同语言类型的音频时长,得到语音数据分析结果,实现教学资源中说话时长的准确分析,从而可以对在线教学平台上中文、英文等教学场景中教师的说话时长进行分析
  • 一种语音数据分析方法系统
  • [发明专利]语音引擎系统-CN202211616098.4在审
  • 周正龙;林峰平;桂烜;张孝山;文志雄 - 深圳市康必达控制技术有限公司;科华数据股份有限公司
  • 2022-12-15 - 2023-04-25 - G10L13/08
  • 本发明提供了一种语音引擎系统,该语音引擎系统应用于语音合成技术领域,包括:知识库、文本输入模块、文本检索模块、文本编码模块、语音转换模块;知识库中存储有多音字信息、各个行业的专业词汇信息;文本输入模块用于接收用户输入的文本信息;文本检索模块用于通过扫描文本信息或者基于文本信息在知识库中进行检索来确定文本信息中的目标文本;其中,目标文本为阿拉伯数字、英文字符、多音字或专业中文词组;文本编码模块用于对文本信息中的目标文本进行转换;语音转换模块用于将转换后的文本信息转换成语音。本发明能够提高语音转换的准确度。
  • 语音引擎系统
  • [发明专利]一种基于声纹的身份识别方法和设备-CN201710414163.8在审
  • 叶建生;胡志尧;姜小华 - 深圳市讯联智付网络有限公司
  • 2017-06-05 - 2017-09-29 - G10L15/26
  • 本发明提出了一种基于声纹的身份识别方法和设备,其中该方法包括当业务应用请求需要用户确认身份信息时,提示所述用户输入语音密码;接收所述用户的语音数据,并将所述语音数据转换为文字信息;将所述文字信息与用户列表中各用户事先设置的预设语音密码中文字信息进行匹配;若所述语音密码匹配成功,获取所述用户的声纹特征;将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配,获取匹配度;若所述匹配度大于预设识别阈值,则确认所述用户的身份识别成功。以此通过语音和声纹实现了对用户身份的识别,实现方便,识别准确,安全性高。
  • 一种基于声纹身份识别方法设备
  • [实用新型]智能型联想式中文语音-CN00228658.0无效
  • 曾凯 - 曾凯
  • 2000-06-30 - 2001-05-09 - G10L13/00
  • 本实用新型涉及一种智能型联想式中文语音卡,由语音库芯片、CPU芯片、语音合成芯片、放音电路组成,语音库芯片存贮了采用LPC算法压缩语音库,包括向量表和音素库两部分,其中向量表由包含了国家标准GB2312汉字字符集中所有的汉字和常用的词组、短语的发音向量表及包含ASCII字符集中常用字符的发音向量表;具有音质清晰、语言流畅、自动识别汉字中的多音字的优点,整个音库包括向量区和音素区,容量小,具有极强通用性,可作为一个标准件用于需具备语音发声的电子信息产品中
  • 智能型联想中文语音卡
  • [外观设计]车载终端的输入法图形用户界面-CN201930150726.7有效
  • 马东辉;卢素慧 - 北京车和家信息技术有限公司
  • 2019-04-04 - 2020-01-10 - 14-02
  • ;设计1主视图是中文拼音九键输入法界面;设计1变化状态图1是中英文26键输入法主界面英文键盘;设计1变化状态图2是中文语音输入主界面;设计1变化状态图3是中文手写输入法主界面。;设计2主视图是中文拼音九键输入法界面;设计2变化状态图1是中文拼音九键输入法输入中的状态界面。“123”按钮时,进入中文数字和符号键盘;设计3变化状态图4是展示在中文键盘模式下输入文字过程;设计3变化状态图5是当点击键盘左上角图标时,出现气泡,可选择切换输入法类型;设计3变化状态图6是点击右上角箭头展开更多文字联想项;设计4主视图是中文语音输入主界面,点击中间蓝色按钮系统将开始识别语音;设计4变化状态图是语音录入状态。;此时中间按钮会有向外部散发圆圈的动画效果,当用户说话完毕,再次点击此按钮则完成输入。;设计5主视图中文手写输入法主界面,在中间空白区域可书写文字;设计5变化状态图1是展示手写过程中的文本联想;设计5变化状态图2是当点击键盘左上角图标时,出现气泡,可选择切换输入法类型;设计5变化状态图3
  • 车载终端的输入法图形用户界面
  • [发明专利]一种中英文混合语音识别方法及装置-CN201910794593.6有效
  • 郑能恒;容韦聪;史裕鹏 - 深圳大学
  • 2019-08-27 - 2022-02-15 - G10L15/06
  • 本发明适用于语音识别技术领域,提供了一种中英文混合语音识别方法及装置,方法包括:获取语音训练样本,语音训练样本采样于中英文语料库,中英文语料库包括中文语料库、英文语料库、中英文混合语料库;通过语音训练样本对LSTM‑CTC端到端网络进行训练,并修改LSTM‑CTC端到端网络的softmax层,以使softmax层输出的字符为Unicode编码方式;根据softmax层输出的字符获得语音识别网络模型;将待识别语音输入语音识别网络模型,并通过RNN‑LM语言模型对语音识别网络模型的输出进行处理,获得基于待识别语音语音识别结果;其中,RNN‑LM语言模型由语音训练样本的文本训练获得。通过本发明能够有效提高根据LSTM‑CTC端到端网络建立语音识别网络模型的过程中,CTC的解码效率,提升识别性能。
  • 一种中英文混合语音识别方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top