[发明专利]利用语音输入以建构中文新词的方法及装置无效

专利信息
申请号: 200510007345.0 申请日: 2005-02-04
公开(公告)号: CN1815557A 公开(公告)日: 2006-08-09
发明(设计)人: 黄良声;蔡锦和;王瑞璋;沈家麟 申请(专利权)人: 台达电子工业股份有限公司
主分类号: G10L15/08 分类号: G10L15/08;G10L15/10;G10L15/00;G06F17/28
代理公司: 北京中原华和知识产权代理有限责任公司 代理人: 寿宁;张华辉
地址: 中国*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明是关于一种利用语音输入以建构中文新词的方法及装置,其目的是要解决语音辨识系统,特别是非特定语者中文语音辨识系统,面临词汇不足时,一个方便的增加新词汇的方式。中文的词是由一个个中文字所组成,因此,把构成词的字描述完成,就是描述词了。此方法是利用麦克风逐一输入描述中文字或其读音的语音讯号,从语音讯号中取得特征参数,利用声学模型、词汇资料库、语言模型与特征参数作比对以判断相应的字汇或音节,储存至暂存单元。使用者可确认完成与否,若完成,则将暂存单元内储存的字元组与音节组交由组合单元组合为一新词汇。
搜索关键词: 利用 语音 输入 建构 中文 新词 方法 装置
【主权项】:
1、一种利用语音输入以建构中文新词的方法,其包括以下步骤:接收一语音讯号;撷取该语音讯号的一特征参数;根据一自然声学模型以判断与该特征参数相应的音节或字元;储存判断所得的音节或字元;以及进行上述步骤并组合所得到的所有音节或字元以建构新词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于台达电子工业股份有限公司,未经台达电子工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200510007345.0/,转载请声明来源钻瓜专利网。

同类专利
  • 音频分类模型的训练方法、分类方法、装置及设备-202310237681.2
  • 冯鑫 - 腾讯科技(深圳)有限公司
  • 2023-03-03 - 2023-10-27 - G10L15/08
  • 本申请公开了一种音频分类模型的训练方法、分类方法、装置及设备,涉及人工智能领域。包括:对样本音频进行特征提取,得到样本音频的样本音频特征;将样本音频特征输入音频分类模型进行n层分类,得到n个预测结果,其中,不同预测结果基于音频分类模型中不同分层输出的微元信息分类得到,n为正整数,且n≥2;对n个预测结果进行加权投票,得到音频预测标签,音频预测标签用于指示预测到的样本音频所属的类别;基于音频预测标签与样本音频对应的真实标签间的差异,训练音频分类模型。本申请实施例中,通过融合多个分层对应分类结果的方式,有助于提高音频分类的准确性。
  • 语音识别方法、装置、电子设备及存储介质-202310798449.6
  • 佟欣欣;鲍晓;许丽;万根顺;熊世富;高建清;刘聪 - 科大讯飞股份有限公司
  • 2023-06-29 - 2023-10-27 - G10L15/08
  • 本申请提出一种语音识别方法、装置、电子设备及存储介质,涉及语音识别技术领域。该语音识别方法可以包括:获取目标语音的第一类特征和第二类特征;其中,所述第一类特征为表征语音内容的声学特征,所述第二类特征为表征情绪的声学特征;根据所述第一类特征和所述第二类特征,确定对所述目标语音的语音识别结果,其中,所述语音识别结果中包括添加有标点符号的文本内容。本申请提供的技术方案能够提高语音识别中标点符号标记的准确性。
  • 语音识别方法、系统、设备和介质-201811068321.X
  • 张仕良;雷鸣 - 阿里巴巴集团控股有限公司
  • 2018-09-13 - 2023-10-27 - G10L15/08
  • 一种语音识别方法、系统、设备和介质,包括:提取接收到的语音信号的声学特征;将所述语音信号的声学特征输入至语音识别模型组件,以便所述语音识别模型组件对所述语音信号进行识别处理;获取所述语音识别模型组件输出的、所述语音信号对应的语音序列;其中,所述语音识别模型组件是基于多个前馈神经网络模块构建、并通过时序分类优化函数形成的损失函数进行模型训练而生成的模型组件。采用本发明实施例后,能够提高声学模型语音识别的实时性。
  • 语音提示方法、终端及存储介质-202180095290.0
  • 朱荣昌;成章涛 - 深圳传音控股股份有限公司
  • 2021-04-16 - 2023-10-24 - G10L15/08
  • 一种语音提示方法、终端及存储介质,该语音提示方法通过监测终端是否满足预设触发条件(S11),若判断终端满足预设触发条件则确定目标信息(S12),之后对目标信息进行语音提示(S13),该方法并不需要用户主动唤醒语音助手,也不需向语音助手主动表达用户目的后才提供语音服务,与现有技术相比本申请提供的语音提示方法能够提供更好的与用户的交互,给用户来带更佳的用户体验。
  • 一种命令词识别方法及装置-202010268839.9
  • 张猛;冯大航;陈孝良 - 北京声智科技有限公司
  • 2020-04-08 - 2023-10-10 - G10L15/08
  • 本发明公开了一种命令词识别方法及装置,其中方法为:获取待识别语音帧;基于解码网络和预设解码算法,对所述待识别语音帧进行解码,以识别所述待识别语音帧对应的命令词;其中,解码网络的各状态节点组中从首状态节点至尾状态节点经过的每条路径均与一个命令词唯一对应;所述各状态节点组包括复合状态节点组;所述复合状态节点组包括复合状态节点,所述复合状态节点的出度和/或入度不小于2,从而所述复合状态节点组的多条路径对应多个命令词。
  • 语音识别方法、装置、电子设备和存储介质-202310786366.5
  • 黄彬彬 - 深圳绿米联创科技有限公司
  • 2023-06-29 - 2023-10-03 - G10L15/08
  • 本申请涉及一种语音识别方法、装置、电子设备和存储介质。语音识别方法包括:获取目标用户的语音信息并提取语音信息的语音特征;将语音特征与第一语音特征模板进行比对,得到第一比对结果;若第一比对结果满足第一匹配条件,则将语音特征与第二语音特征模板进行比对,得到第二比对结果;若第一比对结果满足第二匹配条件,或第二比对结果满足第三匹配条件,则确定语音识别成功;其中,第二语音特征模板和第一语音特征模板对应于相同的模板词,且第二语音特征模板基于对目标用户的语音特征进行动态跟踪得到的个性化语音特征生成。采用本申请的方案,能够提高语音识别的成功率。
  • 一种具备梳理文本内容优势的鉴伪分析系统-202310814449.0
  • 郑威;云剑;凌霞;郑晓玲;周凡棣;海涵;辛鑫;刘澎 - 中国信息通信研究院
  • 2023-07-04 - 2023-09-29 - G10L15/08
  • 本发明公开了一种具备梳理文本内容优势的鉴伪分析系统,涉及音频内容鉴定技术领域,用于解决在进行音频内容分析的过程中,鉴别音频中提及的优势内容是否为真实信息时存有一定的误差,所述系统包括以下模块:音频输入模块,用于输入音频内容;音频内容分析模块,用于对输入的音频内容进行预处理和语音处理,生成能对音频内容提及优势进行分析的语音内容系数;音频内容转录模块,用于将输入的音频内容进行文本转录,并生成转录文本内容;文本内容特征提取模块:用于对转录文本内容进行相关特征的提取和比对,并生成用于处理文本内容优点的文本内容系数;模型分析模块:用于将语音内容系数和文本内容系数进行模型分析,并生成比对系数。
  • 声纹识别方法及装置-201811378714.0
  • 赵情恩;索宏彬;雷赟 - 阿里巴巴集团控股有限公司
  • 2018-11-19 - 2023-09-26 - G10L15/08
  • 本发明公开了一种声纹识别方法,包括:统计多个相似度分值的分布情况,相似度分值用于表示待识别的语音信号与预存的声纹的相似度;根据所述分布情况来调整分类阈值,分类阈值用于对相似度分值进行分类,以判断待识别的语音信号与预存的声纹是否对应于同一个用户。本发明一并公开了相应的声纹识别装置。
  • 一种语音识别系统-202311037584.5
  • 岑雄杰 - 岑雄杰
  • 2023-08-17 - 2023-09-22 - G10L15/08
  • 本发明涉及语音系统,更具体的说是一种语音识别系统,包括携带部件、连接部件、调整臂、语音收集部件、降噪部件、语音识别部件、语音规则部件和语音输出部件;语音收集部件用于收集语音,并将收集的语音传输给降噪部件;降噪部件用于对收集的语音进行语音降噪处理;语音识别部件对降噪处理后的语音进行识别;语音规则部件对识别后的语音进行判断,符合命令规则的语音执行相对的语音命令,不符合命令规则的语音发送给语音输出部件;语音输出部件对接收的语音进行显示处理;降噪部件的降噪规则为,将语音分为连续声音和阶段声音,连续声音为外部噪音进行剔除,阶段声音为目标语音进行传输。
  • 命令词的置信度的确定方法、确定装置与处理器-202210211181.7
  • 雷延强 - 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司
  • 2022-03-03 - 2023-09-19 - G10L15/08
  • 本申请提供了一种命令词的置信度的确定方法、确定装置与处理器,该确定方法包括:至少根据各命令词的字数,对多个命令词进行分类,得到分类结果,分类结果包括多个目标类别以及各目标类别中的命令词;至少采用同一个目标类别中的命令词以及对应的标注信息对初始置信度分类器进行训练,生成目标置信度分类器,标注信息为表征命令词是否为预定命令词,预定命令词用于控制智能设备执行对应的动作;接收目标命令词,并确定目标类别,将目标命令词特征信息输入至对应的目标置信度分类器中,计算目标命令词的置信度。本方案实现了同一个目标类别训练得到一个目标置信度分类器,较好地平衡了置信度分类精度和置信度分类器个数。
  • 车载语音包确定方法、装置、终端设备及车辆-202310671568.5
  • 曾庆生;甄理;严增辉;高桐 - 长城汽车股份有限公司
  • 2023-06-07 - 2023-09-12 - G10L15/08
  • 本申请实施例适用于车辆技术领域,提供了一种车载语音包确定方法、装置、终端设备及车辆,该方法包括:采集目标对象的目标信息;根据目标信息确定目标对象的爱好特征;在预设的语音包数据库中查询与爱好特征相匹配的目标语音包;若检测到目标对象输入的确认指令,则下载目标语音包至车辆的车机交互终端。采用上述方法可以减少目标语音包的确定时间,且提高目标对象的使用体验。
  • 企业名称识别方法及装置-202010227831.8
  • 王猛;周寅;王天越;赵逸青 - 中国工商银行股份有限公司
  • 2020-03-27 - 2023-09-12 - G10L15/08
  • 本申请提供了一种企业名称识别方法及装置,该方法包括:获取目标语音对应的文字信息;将所述目标语音对应的文字信息输入预获取的企业名称实体词汇提取模型,并将该企业名称实体词汇提取模型的输出作为该目标语音对应的企业名称实体词汇;基于对齐音码相似度算法和滑动窗口相似度算法分别得到所述企业名称实体词汇与预设的企业名称候选集之间的相似度结果,并根据得到的两个相似度结果确定所述目标语音对应的目标企业名称的识别结果。本申请能够通过有效提高企业名称识别的准确性和效率,以提高人工智能客户转接或者企业风险控制的准确性。
  • 声音识别方法和系统-201811051604.3
  • 薛少飞;张仕良 - 阿里巴巴集团控股有限公司
  • 2018-09-10 - 2023-09-12 - G10L15/08
  • 本申请公开了一种声音识别方法和系统。其中,该方法包括:获取声音信号;对声音信号进行特征提取,得到声音信号的声学特征信息;利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC‑BLSTM模型和DFSMN模型。本申请解决了现有技术中声音识别方法在复杂环境中的识别准确率不高的技术问题。
  • 语音识别方法、装置、计算机设备及存储介质-202310760915.1
  • 余小琴;杨张辉;高可攀 - 深圳市潮流网络技术有限公司
  • 2023-06-26 - 2023-09-08 - G10L15/08
  • 本申请实施例提供了一种语音识别方法、装置、计算机设备及存储介质,该方法通过获取测试模板、参考模板,并根据测试模板的测试时长、原始测试语音特征数据中无效的语音特征数据的第一时长、第一时长的测试时长初始值、参考模板的参考时长、原始参考语音特征数据中无效的语音特征数据的第二时长、第二时长的参考时长初始值,确定测试模板与参考模板构成的目标搜索区域,确定目标搜索区域中的测试模板与参考模板之间的语音匹配度,并根据语音匹配度、预设匹配度阈值确定测试模板的语音识别结果,实现了自适应调整目标搜索区域,提高了目标搜索区域的完整性和准确性,减少了不必要的计算量,从而提高了语音识别效率。
  • 日志分类方法、装置、设备及存储介质-202310646720.4
  • 李岳璇 - 博泰车联网(南京)有限公司
  • 2023-06-01 - 2023-09-08 - G10L15/08
  • 本申请实施例公开了一种日志分类方法、装置、设备及存储介质,其中,所述方法包括:基于语音交互过程对应的日志关键词,在预设时段内的多个待筛选日志中确定至少一个语音日志;对每一所述语音日志进行解析,得到每一所述语音日志对应的语音交互信息;基于各所述语音日志对应的语音交互信息对所述至少一个语音日志进行分类,得到所述预设时段内语音交互场景的场景类型和所述场景类型对应的日志分类结果。
  • 语音识别方法、装置、电子设备和存储介质-202310880009.5
  • 胡今朝;吴重亮;马志强;李永超 - 安徽讯飞寰语科技有限公司
  • 2023-07-17 - 2023-09-05 - G10L15/08
  • 本发明提供一种语音识别方法、装置、电子设备和存储介质,涉及语音识别技术领域,该方法包括:将采集的待识别语音输入声学模型,得到声学模型输出的第一文本;在检测到第一文本中包括实体词标记符时,将第一文本中的实体词部分输入实体语言模型,得到实体语言模型输出的实体词部分的第一置信度,并将第一文本输入通用语言模型,得到通用语言模型输出的第一文本的第二置信度;实体词部分包括实体词标记符和目标实体词;基于第一置信度和第二置信度对目标实体词进行激励,得到待识别语音的语音识别结果。本发明提供的技术方案能够避免语音识别过程中实体词的误触发。
  • 用于识别词槽的方法、装置、设备以及存储介质-202010523633.6
  • 丁鑫哲;孙辉丰;孙叔琦;孙珂;李婷婷 - 北京百度网讯科技有限公司
  • 2020-06-10 - 2023-09-05 - G10L15/08
  • 本申请公开了用于识别词槽的方法、装置、设备以及存储介质,涉及自然语言处理、深度学习技术领域。具体实现方案为:接收目标语句;根据目标语句以及预先设置的实体集合,确定目标语句的第一词槽识别结果;根据目标语句以及预先训练的词槽识别模型,确定目标语句的第二词槽识别结果,词槽识别模型用于表征语句与词槽识别结果的对应关系;根据第一词槽识别结果以及第二词槽识别结果,确定目标词槽识别结果。本实现方式能够即时对识别用户设置的新的实体词,无需收集大量数据,无需训练模型,无需进行模型效果优化,即可识别用户个性化的新词,具有即时、准确、易用的特性。
  • 基于个性化否定来适应热词辨识-202180085989.9
  • 亚历山大·克拉昆;马修·谢里菲 - 谷歌有限责任公司
  • 2021-11-11 - 2023-08-25 - G10L15/08
  • 一种方法(600),包括接收表征在由用户设备(102)捕获的音频(118)中由第一级热词检测器(210)检测到的热词事件的音频数据(120)。方法还包括使用第二级热词检测器(220)处理音频数据以确定在音频数据的第一段(121)中是否检测到热词。当热词未被第二级热词检测器检测到时,方法包括:将音频数据的第一段分类为包含导致第一级热词检测器对流式传输音频中的热词事件的误检测的否定热词。基于被分类为包含否定热词的音频数据的第一段,方法包括更新第一级热词检测器以防止在包含否定热词的后续音频数据中触发热词事件。
  • 一种基于多视角的语音关键词检测与定位方法及装置-202310675479.8
  • 林毅;杨彬 - 四川大学
  • 2023-06-08 - 2023-08-25 - G10L15/08
  • 本发明公开了一种基于多视角的语音关键词检测与定位方法及装置,涉及语音检索领域,首先从待检测语音音频中切分语音段并提取语音段的语音特征,然后通过采用多任务框架的端到端文本关键词检测模型和使用共享权重参数的孪生神经网络样例关键词检测模型提取语音特征的高层特征,分别与检测文本或检测语音样例的高层特征进行相似度匹配,最后融合两个模型的结果进行关键词检测和位置定位。本发明结合文本和语音两个角度进行检测能够提供可靠的判决置信度,提升关键词的检出率和检出准确率,检索效果较好,并且可以给出关键词在语音音频中的准确时间位置。
  • 一种基于多编码器的通话语音识别方法-202310418560.8
  • 邱原;肖浩;魏锦波;刘作;黎聪;寇佳威;张闯;阮梓涵 - 西安理工大学;广西东信易通科技有限公司
  • 2023-04-19 - 2023-08-22 - G10L15/08
  • 本发明公开了一种基于多编码器的通话语音识别方法,首先对通话语音按声道信息进行说话人分类;将分类好的语音按说话时间和空白信息进行切分排序;对排序好的语音进行预处理,并转为80维的Fbank特征;将Fbank特征按照前一句、识别句和后一句进行拼接作为语境信息的来源;将拼接后的语音和目标句分别输入到两个不同的编码器中,按照不同的方式进行语境信息的融合,获得包含语境信息的隐空间特征;再输入到历史解码器中,在历史解码器中与之前识别的文本特征进行融合,得到包含上下文的特征信息;最终进行解码操作得到目标语音的识别结果。本发明通过充分挖掘通话中的语境信息,弥补了传统语音识别对于语境信息的缺失,提高了通话语音识别的精度。
  • 语音识别方法、装置、计算机设备及存储介质-202310688282.8
  • 赵梦原;王健宗;程宁 - 平安科技(深圳)有限公司
  • 2023-06-09 - 2023-08-15 - G10L15/08
  • 本发明涉及语音识别和数字医疗领域,尤其涉及一种语音识别方法、装置、计算机设备及存储介质。其方法包括:获取待识别语音数据;通过语音识别模型的语音编码器对待识别语音数据进行编码处理,得到语音特征;通过语音识别模型的语音词嵌入器对语音特征进行词嵌入处理,得到词嵌入特征;根据语音特征和词嵌入特征,对待识别语音数据进行语音识别,得到语音识别结果。本发明的获得的语音识别结果不仅仅局限于用于语音识别模型训练的训练数据集中的词信息,还考虑了输入数据的隐藏词信息,可提高语音识别过程中语法分析和语音分析的效果,从而提高语音识别的准确率。
  • 一种基于层次信息融合的声学场景分类网络模型-202310549659.1
  • 江港;马忠臣;张建明 - 江苏大学
  • 2023-05-16 - 2023-08-15 - G10L15/08
  • 本发明提供了一种基于层次信息融合的声学场景分类网络模型,包括声学场景特征学习模块和层次信息融合模块,其中声学场景特征学习模块提取音频中的特征并输入至层次信息融合模块;层次信息融合模块中设有父类分类器和子类分类器,层次信息融合模块内先对输入的特征分两路做1D卷积得到父类表示和子类表示;之后将父类表示输入父类分类器得到预测的父类类别,将父类表示与子类表示拼接融合后输入子类分类器得到预测的子类类别。本发明声学场景分类网络模型中通过设置父类分类器和子类分类器,并在子类分类的过程中,将父类信息融合进子类信息中,以此迫使网络模型学习类别间的层次结构关系,最终有效提升了网络模型的分类准确率。
  • 一种智能车载语音控制模块-202310711211.5
  • 徐奇 - 上海嘉擎数字科技有限公司
  • 2023-06-15 - 2023-08-11 - G10L15/08
  • 本发明涉及车载语音技术领域,特别是涉及一种智能车载语音控制模块,包括语音信号采集模块、语音信号识别模块、主控制模块、CAN通信模块和执行模块。本发明通过经过拾音模块、增益放大模块和语音过滤模块,再根据人的语音特点建立语音模型,端点检测模块对输入的语音信号进行分析,并抽取所需特征,在此基础上建立语音识别所需的模板,语音信号识别模块识别过程中要根据语音识别的模型,主控制模块存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板,然后根据此模板的定义,通过CAN通信模块传输到执行模块,执行模块通过查表可给出识别结果。
  • 关键词检索方法、装置、电子设备以及存储介质-202211137975.X
  • 张辉;熊新雷;周羊;黄宇鑫;陈泽裕;文灿 - 北京百度网讯科技有限公司
  • 2022-09-19 - 2023-08-11 - G10L15/08
  • 本公开提供一种关键词检索方法、装置、电子设备以及存储介质,涉及语音识别的技术领域,具体涉及语音关键词检索技术领域,可应用于客服业务质检等场景。方案包括:对语音数据进行解码,得到语音数据的文本和解码帧数据,解码帧数据包括文本中每个文字对应的解码帧;针对文本中每个文字,基于该文字的解码帧的时间戳和该文字的相邻文字的解码帧的时间戳,计算该文字的时间信息;对文本进行关键词检索,响应于文本包含有预设的目标关键词,基于目标关键词中的文字的时间信息确定目标关键词的时间信息;生成包含目标关键词和目标关键词的时间信息的检索结果。上述方法在不引入过多的额外模型的基础上,即可准确地获取到目标关键词的时间信息。
  • 语音唤醒方法、系统、存储介质及电子设备-202310558454.X
  • 王啸;付冠宇;李郡;游恒;尚德龙;周玉梅 - 中科南京智能技术研究院
  • 2023-05-17 - 2023-08-08 - G10L15/08
  • 本申请的实施例提供了一种语音唤醒方法、装置、存储介质及电子设备,所述方法包括:获取待识别语音信号;提取所述待识别语音信号的目标特征向量;将所述目标特征向量输入至语音识别神经网络,以通过所述语音识别神经网络输出与所述待识别语音信号对应的语音分类结果,所述语音识别神经网络由依次串行连接的第一卷积层,第一批归一化层,第二卷积层,第三卷积层,第二批归一化层,拼接层,及全连接层组成,其中,所述第二卷积层和所述第三卷积层为二值量化的卷积层;根据所述语音分类结果确定是否唤醒目标设备。本申请的实施例提供的技术方案能降低实现语音唤醒过程中的运算量和占用的内存量,进而提高基于神经网络实现语音唤醒的适用性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top