“G10L15/04”专利分类搜索_专利查询_文献下载_出售_求购_买卖_交易

钻瓜专利网为您找到相关结果389个，建议您升级VIP下载更多相关专利

[发明专利]一种基于语音识别的处理方法和相关装置-CN202211432450.9在审
发明人：汤志远;黄申;商世东 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-11-15 - 公布日： 2023-10-27 - 主分类号： G10L15/04 文献下载
摘要：本申请实施例公开了一种基于语音识别的处理方法和相关装置，提取待处理语音数据中待处理语音片段的第一语音特征输入目标语音识别模型中的浅层计算模块，结合其关联的第一历史信息进行浅层计算得到第一隐层特征；将第一隐层特征输入目标语音识别模型中的目标门控模块进行断点预测得到第一预测结果，有效预测待处理语音片段是否为断点。第一预测结果表示待处理语音片段为断点时，在待处理语音片段切断待处理语音数据并清空第一历史信息；反之，将第一隐层特征输入目标语音识别模型中的深层计算模块进行深层计算得到语音识别结果。该方法确保待处理语音数据中独立语音数据的语义独立性，避免缓存过多的历史信息，提高语音识别的准确性。
一种基于语音识别处理方法相关装置

[发明专利]分句方法与装置、存储介质、电子设备-CN202010651131.1有效
发明人：李钊;刘岩;赵凯;贺雄彪 -专利权人：泰康保险集团股份有限公司
申请日： 2020-07-08 - 公布日： 2023-10-27 - 主分类号： G10L15/04 文献下载
摘要：本公开属于语音识别技术领域，涉及一种分句方法及装置、计算机可读存储介质、电子设备。该方法包括：采集语音信息，并确定与语音信息对应的待测句以及与待测句对应的标准句；划分标准句得到多个标准子句，并在多个标准子句中确定与待测句对应的目标子句；若待测句与目标子句的第一相似度大于第一阈值，确定待测句为所述标准句的子句，以作为与语音信息对应的分句结果。本公开解决了语音识别过程中由于长句停顿现象导致的语音识别错误的问题，提供了根据场景和语料的实际情况进行切割的方式，提高了长句切分的准确度和效率，丰富了分句方法应用在除语音问答系统之外的应用场景，优化了用户体验。
分句方法装置存储介质电子设备

[发明专利]语音端点检测方法、装置、设备及存储介质-CN202210318838.X在审
发明人：李鸽子;迟朋;杨凯悦;朱励轩;单伟伟 -专利权人：华为技术有限公司;东南大学
申请日： 2022-03-29 - 公布日： 2023-10-24 - 主分类号： G10L15/04 文献下载
摘要：本申请提供了一种语音端点检测方法、装置、设备及存储介质。在实施例中，接收音频信号；音频信号包括N个音频帧；确定N个音频帧中第i音频帧的声学特征矩阵，第i音频帧的声学特征矩阵包括第i个音频帧的多个声学特征各自的特征值；根据第i个音频帧的声学特征矩阵、准则层矩阵和目标层矩阵，计算第i个音频帧的阈值；准则层矩阵包括音频帧的多个声学特征在不同语音检测准则下的权重，目标层矩阵包括不同语音检测准则的权重；根据第i个音频帧的阈值，第一门限值和第二门限值，确定第i个语音帧的类型。根本本申请实施例可根据不同场景下的音频的多种声学特征在不同的语音检测准则下所占的比重进行语音端点检测，提高语音端点检测的准确度。
语音端点检测方法装置设备存储介质

[发明专利]语音断句时长的动态确定方法、装置、介质和电子设备-CN202310685219.9在审
发明人：李龙飞;刘杰;陈彩可;张炜玮;林孟超 -专利权人：中国第一汽车股份有限公司;一汽（北京）软件科技有限公司
申请日： 2023-06-09 - 公布日： 2023-10-13 - 主分类号： G10L15/04 文献下载
摘要：本申请提供了一种语音断句时长的动态确定方法、装置、介质和电子设备。本申请基于用户语音的当前静音时长以及前次确定的当前待定时长和当前断句时长和预设最大断句时长更新所述当前待定时长，将所述当前待定时长作为历史待定时长存入历史时长数据集。所述历史时长数据集中保存着对所述用户语音进行静音检测过程中历次静音所对应的历史待定时长。通过所述历史时长数据集中保存的多个历史待定时长动态更新当前断句时长，避免非正常的历史待定时长对确定当前断句时长的影响，且能够根据每个人的说话习惯和语速动态更新当前断句时长，从而满足诗句断句的需要。
语音断句动态确定方法装置介质电子设备

[发明专利]一种词边界估计方法、装置及电子设备-CN202010473529.0有效
发明人：陈孝良;王江;冯大航 -专利权人：北京声智科技有限公司
申请日： 2020-05-29 - 公布日： 2023-10-13 - 主分类号： G10L15/04 文献下载
摘要：本发明提供一种词边界估计方法、装置及电子设备，语音数据中的最小解码单元的WFST解码结果包括所述最小解码单元对应的解码结果以及所述解码结果的时间信息；若所述最小解码单元解码过程中识别出所述预设标识，则将所述时间信息中，识别出所述预设标识的时间确定为所述解码结果的词尾时间边界。即由于本发明中用于生成所述WFST优化模型的样本中的词的词尾设置有一预设标识；所述预设标识表示所述词结束，这样在WFST优化模型解码过程中，若识别出预设标识，则认为当前词结束，将识别出预设标识的时间作为当前词的词尾时间边界，从而可以准确的确定出词尾时间边界。
一种边界估计方法装置电子设备

[发明专利]业务数据质检方法、装置、设备及存储介质-CN202310876385.7在审
发明人：刘晓苓;苟玉鹏;杨俊逸;陈凯利;唐文涛;黄敬;霍鹃;刘东 -专利权人：科大讯飞股份有限公司
申请日： 2023-07-17 - 公布日： 2023-10-03 - 主分类号： G10L15/04 文献下载
摘要：本申请公开了一种业务数据质检方法、装置、设备及存储介质，本申请可以预先在营业厅客服人员侧配备拾音设备，基于此可以实现实时及非实时的按照业务对服务录音数据进行分割的目的，调用预配置的质检分析模型，对每一业务对应的音频数据进行质检分析，得到质检分析结果，并对各业务对应的音频数据的质检分析结果进行统计分析。本申请基于拾音设备自动获取客服人员的服务录音数据，并按照业务对服务录音数据进行分割，便于后续的质检分析及统计，整个过程无需派遣专人驻店监听，节省了人力资源，且可以避免人工监听容易存在的漏检问题。
业务数据质检方法装置设备存储介质

[发明专利]歌词转换点检测方法、装置、计算机设备及存储介质-CN202110775920.0有效
发明人：萧博耀;高旋 -专利权人：深圳万兴软件有限公司
申请日： 2021-07-09 - 公布日： 2023-09-29 - 主分类号： G10L15/04 文献下载
摘要：本发明实施例公开了一种歌词转换点检测方法、装置、计算机设备及存储介质，涉及音频处理技术领域。其中方法包括：获取目标音频数据；对目标音频数据进行检测以得到目标音频数据的节拍；对目标音频数据进行人声分离处理以得到人声数据；计算人声数据的幅值以得到人声能量波形；对人声能量波形进行预处理以得到目标波形；根据目标音频数据的节拍以及预设转换条件对目标波形进行检测以确定歌词的转换点。该方法实现了机器设备对音乐和人声的有效识别，并通过目标音频数据的节拍以及预设转换条件来检测经过处理后的人声数据实现精准地确定歌词的转换点，大大提高了对歌词转换点定位的精度以及效率。
歌词转换检测方法装置计算机设备存储介质

[发明专利]用于感测语音结束的方法和实现该方法的电子设备-CN201780083799.7有效
发明人：金龙浩;苏拉布·帕特里亚;金璇儿;朱佳贤;黄相雄;张世二 -专利权人：三星电子株式会社
申请日： 2017-11-23 - 公布日： 2023-09-26 - 主分类号： G10L15/04 文献下载
摘要：提供了一种装置和方法，该装置的各种实施例包括：麦克风；存储器；以及处理器，所述处理器功能地连接到所述麦克风或所述存储器，其中，所述处理器被配置为：基于语音输入对结束点检测(EPD)时间进行计数；当所述EPD时间到期时，确定所述语音输入的最后的词语是否对应于存储在所述存储器中的先前配置的词语；以及，如果所述最后的词语对应于所述先前配置的词语，则延长所述EPD时间并等待接收语音输入。另外，其他实施例也是可能的。
用于语音结束方法实现电子设备

[发明专利]一种语音交互方法以及语音交互系统-CN201810473045.9有效
发明人：孙珏;徐曼 -专利权人：蔚来（安徽）控股有限公司
申请日： 2018-05-17 - 公布日： 2023-09-19 - 主分类号： G10L15/04 文献下载
摘要：本发明涉及一种语音交互方法以及语音交互系统。该方法包括：预处理步骤，对输入的语音信息进行预处理并输出语音段；语义识别步骤，对所述预处理步骤输出的语音段进行语义识别并输出语义信息；性别分类步骤，对所述预处理步骤输出的语音段识别出用户性别并输出性别信息；以及融合处理步骤，融合所述性别信息和所述语义信息而获得对于所述语音信息的个性化回复信息。根据本发明的音交互方法以及语音交互系统，能够根据用户的性别进行区分回复，提高用户体验，提高语音交互的智能化。
一种语音交互方法以及系统

[发明专利]一种说话人分割方法、装置、设备和存储介质-CN202010621958.8有效
发明人：张鹏;胡新辉;徐欣康 -专利权人：浙江同花顺智能科技有限公司
申请日： 2020-06-30 - 公布日： 2023-09-12 - 主分类号： G10L15/04 文献下载
摘要：本申请涉及说话人分割方法、装置、设备和存储介质。该方法包括：确定语音信息中待进行说话人分割的语音的长度；比较所述语音的长度与预设阈值之间的大小；基于比较结果对所述语音进行语音段的划分；确定划分后的语音的切分点；基于所述切分点对语音中的说话人进行区分。如此，可提升短语音的切分稳定性，并提高整体语音的切分精度。
一种说话分割方法装置设备存储介质

[发明专利]语音识别方法、装置、电子设备和存储介质-CN202310499910.8在审
发明人：赵翔宇 -专利权人：阿里巴巴（中国）有限公司
申请日： 2023-04-28 - 公布日： 2023-09-05 - 主分类号： G10L15/04 文献下载
摘要：本申请实施例提供了一种语音识别方法、装置、电子设备和存储介质，该语音识别方法包括：采集待识别语音片段；在采集所述待识别语音片段时并行对已采集到的语音数据进行编码，获得所述待识别语音片段的编码结果；对所述待识别语音片段的编码结果进行解码，获得所述待识别语音片段对应的文本数据。本方案能够在算力资源受限的语音识别设备中降低语音识别的时延。
语音识别方法装置电子设备存储介质

[发明专利]一种振铃音识别方法及装置-CN202310850257.5在审
发明人：樊冯飞;姚树杰 -专利权人：鼎富智能科技有限公司
申请日： 2023-07-11 - 公布日： 2023-09-01 - 主分类号： G10L15/04 文献下载
摘要：本申请实施例提供一种振铃音识别方法及装置，包括从预设平台获取第一时间范围内的每一通未接通话的信道数据；对于每一通未接通话，利用预设模型从信道数据中截取多个语音段；利用预设模型对多个语音段依次进行振铃音识别，以及，在识别出其中一个语音段对应的振铃音类型后，停止识别。可见，本申请实施例提供的方法考虑到未接通话的振铃音内容是不断重复的，因此，该方法对未接通话的信道数据进行了切分截取，之后基于小的语音段进行振铃音识别。这样，减小了对未接通话的识别数据量，缩短了振铃音类型识别的时间，提升了识别效率。
一种振铃识别方法装置

[发明专利]言语发音噪声事件的自动检测和衰减-CN202180062729.X在审
发明人：叶宗鑫;G·琴加莱;M·D·德伯格 -专利权人：杜比国际公司
申请日： 2021-08-11 - 公布日： 2023-08-29 - 主分类号： G10L15/04 文献下载
摘要：描述了一种对包括至少一个言语发音噪声事件的输入音频信号执行自动音频增强的方法。所述方法包括：将所述输入音频信号分割成多个音频帧；从所述音频帧获得至少一个特征参数；以及至少部分地基于所获得的特征参数来确定所述输入音频信号内的所述言语发音噪声事件的相应类型和与所述言语发音噪声事件相关联的相应时间‑频率范围。
言语发音噪声事件自动检测衰减

[发明专利]语音断句方法、装置、计算机设备及存储介质-CN202110725596.1有效
发明人：曹磊;李俊蓉 -专利权人：平安科技（深圳）有限公司
申请日： 2021-06-29 - 公布日： 2023-08-18 - 主分类号： G10L15/04 文献下载
摘要：本发明涉及人工智能技术领域，提供一种语音断句方法及相关设备，使用静默时间计算模型根据用户语音的语速语调及用户参数计算静默时间，以所述静默时间为断点对用户语音进行断句处理，实现了千人千面的打断判断；在得到多个第一断句语音后，使用词汇模型识别每个第一断句语音中的末端字词是否为目标字词，从而在识别到有目标末端字词为目标字词时，对包含目标末端字词的目标第一断句语音进行断句处理得到多个第二断句语音，将包含目标末端字词的第二断句语音与目标第一断句语音相邻的第一断句语音进行合并处理得到第三断句语音，最后根据第三断句语音对第一断句语音进行更新，得到目标断句语音，实现了对用户语音的正确断句。
语音断句方法装置计算机设备存储介质

[发明专利]音频识别方法、装置和存储介质-CN202310456605.0在审
发明人：王运侠 -专利权人：思必驰科技股份有限公司
申请日： 2023-04-25 - 公布日： 2023-08-15 - 主分类号： G10L15/04 文献下载
摘要：本申请公开了一种音频识别方法、装置和存储介质，涉及音频识别技术领域，所述方法包括：通过将目标音频数据输入至音频识别模型；通过音频识别模型将目标音频数据分割为n个chunk，n为大于1的整数；对于n个chunk中的每个chunk，通过音频识别模型获取当前chunk的历史状态，根据历史状态和当前chunk对当前chunk进行计算；历史状态为在计算当前chunk的前一chunk时在attention操作之前计算并保存的状态；通过音频识别模型根据各个chunk的计算结果输出识别之后的目标音频数据。解决了现有技术中音频识别效率较低的问题，达到了可以通过记录历史状态，进而通过历史状态和当前chunk对当前chunk进行计算，而无需基于前一chunk的全部数据进行计算，提高音频识别效率的效果。
音频识别方法装置存储介质

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 389 条