专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果389个,建议您升级VIP下载更多相关专利
  • [发明专利]一种基于语音识别的处理方法和相关装置-CN202211432450.9在审
  • 汤志远;黄申;商世东 - 腾讯科技(深圳)有限公司
  • 2022-11-15 - 2023-10-27 - G10L15/04
  • 本申请实施例公开了一种基于语音识别的处理方法和相关装置,提取待处理语音数据中待处理语音片段的第一语音特征输入目标语音识别模型中的浅层计算模块,结合其关联的第一历史信息进行浅层计算得到第一隐层特征;将第一隐层特征输入目标语音识别模型中的目标门控模块进行断点预测得到第一预测结果,有效预测待处理语音片段是否为断点。第一预测结果表示待处理语音片段为断点时,在待处理语音片段切断待处理语音数据并清空第一历史信息;反之,将第一隐层特征输入目标语音识别模型中的深层计算模块进行深层计算得到语音识别结果。该方法确保待处理语音数据中独立语音数据的语义独立性,避免缓存过多的历史信息,提高语音识别的准确性。
  • 一种基于语音识别处理方法相关装置
  • [发明专利]分句方法与装置、存储介质、电子设备-CN202010651131.1有效
  • 李钊;刘岩;赵凯;贺雄彪 - 泰康保险集团股份有限公司
  • 2020-07-08 - 2023-10-27 - G10L15/04
  • 本公开属于语音识别技术领域,涉及一种分句方法及装置、计算机可读存储介质、电子设备。该方法包括:采集语音信息,并确定与语音信息对应的待测句以及与待测句对应的标准句;划分标准句得到多个标准子句,并在多个标准子句中确定与待测句对应的目标子句;若待测句与目标子句的第一相似度大于第一阈值,确定待测句为所述标准句的子句,以作为与语音信息对应的分句结果。本公开解决了语音识别过程中由于长句停顿现象导致的语音识别错误的问题,提供了根据场景和语料的实际情况进行切割的方式,提高了长句切分的准确度和效率,丰富了分句方法应用在除语音问答系统之外的应用场景,优化了用户体验。
  • 分句方法装置存储介质电子设备
  • [发明专利]语音端点检测方法、装置、设备及存储介质-CN202210318838.X在审
  • 李鸽子;迟朋;杨凯悦;朱励轩;单伟伟 - 华为技术有限公司;东南大学
  • 2022-03-29 - 2023-10-24 - G10L15/04
  • 本申请提供了一种语音端点检测方法、装置、设备及存储介质。在实施例中,接收音频信号;音频信号包括N个音频帧;确定N个音频帧中第i音频帧的声学特征矩阵,第i音频帧的声学特征矩阵包括第i个音频帧的多个声学特征各自的特征值;根据第i个音频帧的声学特征矩阵、准则层矩阵和目标层矩阵,计算第i个音频帧的阈值;准则层矩阵包括音频帧的多个声学特征在不同语音检测准则下的权重,目标层矩阵包括不同语音检测准则的权重;根据第i个音频帧的阈值,第一门限值和第二门限值,确定第i个语音帧的类型。根本本申请实施例可根据不同场景下的音频的多种声学特征在不同的语音检测准则下所占的比重进行语音端点检测,提高语音端点检测的准确度。
  • 语音端点检测方法装置设备存储介质
  • [发明专利]一种词边界估计方法、装置及电子设备-CN202010473529.0有效
  • 陈孝良;王江;冯大航 - 北京声智科技有限公司
  • 2020-05-29 - 2023-10-13 - G10L15/04
  • 本发明提供一种词边界估计方法、装置及电子设备,语音数据中的最小解码单元的WFST解码结果包括所述最小解码单元对应的解码结果以及所述解码结果的时间信息;若所述最小解码单元解码过程中识别出所述预设标识,则将所述时间信息中,识别出所述预设标识的时间确定为所述解码结果的词尾时间边界。即由于本发明中用于生成所述WFST优化模型的样本中的词的词尾设置有一预设标识;所述预设标识表示所述词结束,这样在WFST优化模型解码过程中,若识别出预设标识,则认为当前词结束,将识别出预设标识的时间作为当前词的词尾时间边界,从而可以准确的确定出词尾时间边界。
  • 一种边界估计方法装置电子设备
  • [发明专利]歌词转换点检测方法、装置、计算机设备及存储介质-CN202110775920.0有效
  • 萧博耀;高旋 - 深圳万兴软件有限公司
  • 2021-07-09 - 2023-09-29 - G10L15/04
  • 本发明实施例公开了一种歌词转换点检测方法、装置、计算机设备及存储介质,涉及音频处理技术领域。其中方法包括:获取目标音频数据;对目标音频数据进行检测以得到目标音频数据的节拍;对目标音频数据进行人声分离处理以得到人声数据;计算人声数据的幅值以得到人声能量波形;对人声能量波形进行预处理以得到目标波形;根据目标音频数据的节拍以及预设转换条件对目标波形进行检测以确定歌词的转换点。该方法实现了机器设备对音乐和人声的有效识别,并通过目标音频数据的节拍以及预设转换条件来检测经过处理后的人声数据实现精准地确定歌词的转换点,大大提高了对歌词转换点定位的精度以及效率。
  • 歌词转换检测方法装置计算机设备存储介质
  • [发明专利]一种语音交互方法以及语音交互系统-CN201810473045.9有效
  • 孙珏;徐曼 - 蔚来(安徽)控股有限公司
  • 2018-05-17 - 2023-09-19 - G10L15/04
  • 本发明涉及一种语音交互方法以及语音交互系统。该方法包括:预处理步骤,对输入的语音信息进行预处理并输出语音段;语义识别步骤,对所述预处理步骤输出的语音段进行语义识别并输出语义信息;性别分类步骤,对所述预处理步骤输出的语音段识别出用户性别并输出性别信息;以及融合处理步骤,融合所述性别信息和所述语义信息而获得对于所述语音信息的个性化回复信息。根据本发明的音交互方法以及语音交互系统,能够根据用户的性别进行区分回复,提高用户体验,提高语音交互的智能化。
  • 一种语音交互方法以及系统
  • [发明专利]一种振铃音识别方法及装置-CN202310850257.5在审
  • 樊冯飞;姚树杰 - 鼎富智能科技有限公司
  • 2023-07-11 - 2023-09-01 - G10L15/04
  • 本申请实施例提供一种振铃音识别方法及装置,包括从预设平台获取第一时间范围内的每一通未接通话的信道数据;对于每一通未接通话,利用预设模型从信道数据中截取多个语音段;利用预设模型对多个语音段依次进行振铃音识别,以及,在识别出其中一个语音段对应的振铃音类型后,停止识别。可见,本申请实施例提供的方法考虑到未接通话的振铃音内容是不断重复的,因此,该方法对未接通话的信道数据进行了切分截取,之后基于小的语音段进行振铃音识别。这样,减小了对未接通话的识别数据量,缩短了振铃音类型识别的时间,提升了识别效率。
  • 一种振铃识别方法装置
  • [发明专利]语音断句方法、装置、计算机设备及存储介质-CN202110725596.1有效
  • 曹磊;李俊蓉 - 平安科技(深圳)有限公司
  • 2021-06-29 - 2023-08-18 - G10L15/04
  • 本发明涉及人工智能技术领域,提供一种语音断句方法及相关设备,使用静默时间计算模型根据用户语音的语速语调及用户参数计算静默时间,以所述静默时间为断点对用户语音进行断句处理,实现了千人千面的打断判断;在得到多个第一断句语音后,使用词汇模型识别每个第一断句语音中的末端字词是否为目标字词,从而在识别到有目标末端字词为目标字词时,对包含目标末端字词的目标第一断句语音进行断句处理得到多个第二断句语音,将包含目标末端字词的第二断句语音与目标第一断句语音相邻的第一断句语音进行合并处理得到第三断句语音,最后根据第三断句语音对第一断句语音进行更新,得到目标断句语音,实现了对用户语音的正确断句。
  • 语音断句方法装置计算机设备存储介质
  • [发明专利]音频识别方法、装置和存储介质-CN202310456605.0在审
  • 王运侠 - 思必驰科技股份有限公司
  • 2023-04-25 - 2023-08-15 - G10L15/04
  • 本申请公开了一种音频识别方法、装置和存储介质,涉及音频识别技术领域,所述方法包括:通过将目标音频数据输入至音频识别模型;通过音频识别模型将目标音频数据分割为n个chunk,n为大于1的整数;对于n个chunk中的每个chunk,通过音频识别模型获取当前chunk的历史状态,根据历史状态和当前chunk对当前chunk进行计算;历史状态为在计算当前chunk的前一chunk时在attention操作之前计算并保存的状态;通过音频识别模型根据各个chunk的计算结果输出识别之后的目标音频数据。解决了现有技术中音频识别效率较低的问题,达到了可以通过记录历史状态,进而通过历史状态和当前chunk对当前chunk进行计算,而无需基于前一chunk的全部数据进行计算,提高音频识别效率的效果。
  • 音频识别方法装置存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top