[发明专利]一种基于语种识别系统的语言距离关系的获取方法有效

申请号：	201511005493.9	申请日：	2015-12-28
公开（公告）号：	CN105632485B	公开（公告）日：	2019-05-31
发明（设计）人：	胡浩基;孙乐	申请（专利权）人：	浙江大学
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/10
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	邱启旺
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本文公开发明了一种基于语种识别系统的语言距离关系的获取方法。包含语种识别过程和语言关系图生成过程。语种识别过程是指计算机根据未知说话人所讲的一段语音的声波信号来辨认所讲语音的语言种类的过程。语言关系图生成过程是指根据语言之间的识别率判定语言之间距离最终生成语言关系图的过程。本发明将一种新的语音特征集应用于语种识别系统，并通过GentleAdaBoost算法搭建语种识别系统，利用语种识别系统输出的语种识别率来研究语言之间的距离关系，不仅有效提高了语种识别率，而且取得了和实际基本一致的结果，为语言距离关系的研究提供了一种新的思路。
搜索关键词：	一种基于语种识别系统语言距离关系获取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于语种识别系统的语言距离关系的获取方法，其特征在于，包含语种识别过程和语言关系图生成过程；所述语种识别过程包括以下步骤：(1)训练过程，该步骤包括以下子步骤：(1.1)获取语音样本特征：通过OpenEar工具箱里的底层特征提取模块(Low Level Descriptors)提取训练集语音信号的基本声学特征，然后对这些基本声学特征进行统计分析，将得到的统计值以及统计值的一阶和二阶差分值构成一个维数是6552维的特征向量，并将该特征向量归一化到[0,1]区间；(1.2)初始化训练集的权值分布D_t(i)＝1/m，其中，t是迭代次数，D_t是第t次迭代过程中训练集的权值分布，i＝1,2,...,m，m是训练集的样本个数；(1.3)训练弱分类器h_t，包括以下子步骤：(1.3.1)使用权值分布D_t(i)训练弱分类器集h:X→{‑1,1}，其中，h是弱分类器集，X是训练样本的特征向量集，‑1和1表示样本标签；(1.3.2)根据步骤(1.3.1)得到的弱分类器集h，将弱分类器h_j代入式(1)中，其中，h_j∈h，j＝1,2,...,n，n是弱分类器集h中弱分类器的个数，计算得到h_j在训练数据集上的分类误差ε_j，根据式(2)得到h_t，其中h_t是弱分类器；其中x_i∈X是第i个训练样本的特征向量，y_i是第i个训练样本的标签，且y_i∈{‑1,1}；(1.3.3)根据步骤(1.3.2)得到的h_t，由式(3)更新训练数据集的权值分布，其中，D_t+1是第t+1次迭代过程中训练集的权值分布，Z_t是规范化因子，规范化因子Z_t由式(4)得到：(1.3.4)重复步骤(1.3.1)‑步骤(1.3.3)，直到迭代次数t达到最大迭代次数T，T为大于等于100的正整数；(1.4)根据步骤(1.3)得到的弱分类器h_t，由式(5)得到最终的强分类器H(x)，其中x表示输入的特征向量；(2)识别过程，该步骤包括以下子步骤：(2.1)根据步骤(1.1)得到的归一化到[0,1]区间的特征向量，将该特征向量作为待测语音样本的特征向量x_test；(2.2)根据式(5)计算强分类器H(x)对待测语音样本的特征向量x_test的输出，若输出为正值，则该测试样本属于标签为1的类；若输出为负值，则该测试样本属于标签为‑1的类；语言关系图生成过程包括以下步骤：(1)根据语种识别过程中的步骤(1)得到多类语言中两两语言的强分类器，根据多类语言中两两语言的强分类器计算两两语言的识别率，将两两语言的识别率作为两两语言之间的初始化距离，从而得到多类语言的初始化距离矩阵；(2)根据多类语言的初始化距离矩阵，计算各种语言的坐标，该步骤包括以下子步骤：(2.1)初始化两个集合S₁和S₂，其中，S₁中的元素是语言关系图上坐标未定的语言编号，S₂中的元素是坐标已定的语言编号，取S₁＝{1,2,...,m}，其中m为语言类别数，(2.2)选择初始化距离矩阵中距离值最小的两种语言，定义其中一种语言的坐标为(0,0)，另一种语言的x坐标是这两种语言之间的距离，y坐标为0；假设选定的两种语言编号为1和2，则S₁＝{3,4,...,m}，S₂＝{1,2}；(2.3)根据初始化距离矩阵中两两语言的距离值，在S₁中选择出能够与S₂中两个点构成三角形并且三边之和最小的语言，并计算出该语言的坐标，同时更新集合S₁，S₂；(2.4)在S₁中选择能与S₂中所有点构成三角形个数最多的语言，如果三角形个数的最大值存在多种语言，那么选择第一种，并根据该语言与S₂中的点所构成的三角形，计算出该语言所有可能的坐标，选择使得总距离误差最小的坐标作为该语言最终的坐标；总距离误差E_error的定义如下：其中，C_c(i)表示用语言的坐标计算的第i个三角形的周长，C(i)表示用距离矩阵中的距离作为第i个三角形的边长计算出的周长，n表示三角形的个数；更新集合S₁，S₂；(2.5)重复步骤(2.4)，直到(2.6)依次更新S₂中每个点的坐标；在更新一个点时，固定其余各点的坐标；通过要更新的点与其余各点构成的三角形，计算出该点所有可能的坐标，并将总距离误差最小的坐标作为该点的新坐标；(2.7)重复步骤(2.6)，直到达到最大迭代次数或者总的距离误差收敛；(3)根据步骤(2)中得到的各语言的坐标绘制语言关系图，从而获得语言之间的距离关系。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201511005493.9/，转载请声明来源钻瓜专利网。

同类专利

基于语音识别的语音采集方法及系统-201610679482.7
发明人：陈明秋;毛伟文 -专利权人：珠海市杰理科技股份有限公司
申请日： 2016-08-16 - 公布日： 2019-11-12 - 主分类号： G10L15/00
摘要：本发明提供一种基于语音识别的语音采集方法及系统。其中方法包括：采集模拟语音信号；根据采集到的当前模拟语音信号和往时模拟语音信号计算对当前模拟语音信号进行放大的放大倍率，得到当前放大倍率；根据当前放大倍率对当前模拟语音信号进行放大，得到放大的当前模拟语音信号；将放大的当前模拟语音信号进行模数转换，得到当前数字语音信号，并将当前数字语音信号作为语音识别的输入信号。其对当前模拟语音信号进行放大的当前放大倍率是实时变化的，能为当前模拟语音信号提供一个比较好的当前放大倍率，使放大处理后的当前模拟语音信号不会出现信号失真或精度不够的情况，可以为语音识别提供一个良好的信号输入基础，提高语音识别的识别率。

一种音频会议系统-201821926699.4
发明人：孙昌勋;许志强 -专利权人：北京容联易通信息技术有限公司
申请日： 2018-11-21 - 公布日： 2019-11-12 - 主分类号： G10L15/00
摘要：本实用新型涉及一种音频会议系统，包括服务器和多个客户端，所述服务器包括音频获取单元，音频处理单元，信息传输单元和存储单元，所述客户端包括电源模块，无线网络接口，麦克风，扬声器，显示器，存储器和控制模块，所述音频会议系统，通过在每个客户端设置显示屏，解决了需要可视信息传送时，因投影图像的可视范围和视觉距离而对会场布置和会议规模造成的限制。此外，移动显示屏还可作为同声传译终端使用，能够简化系统设备种类，同时降低对会议环境的需求。

一种智能通信方法及系统-201910831951.6
发明人：刘汉东 -专利权人：广东以诺通讯有限公司
申请日： 2019-09-04 - 公布日： 2019-11-08 - 主分类号： G10L15/00
摘要：本发明提供的一种智能通信方法及系统，其方法包括以下步骤：识别对方的语言环境；录入己方即将发送的语言信息；根据己方录入的语言信息分析己方的语言环境；对比判断己方的语言环境和对方的语言环境是否相同；若己方的语言环境与对方的语言环境相同，则直接将己方的语言信息发送给对方；若己方的语言环境与对方的语言环境不同，则将己方发送的语言信息转换成对方语言环境对应的语言信息，然后将其发送给对方。通过学习识别对方的语言环境自动转换通信过程中的语言表现形式，从而解决非对称场景下即时通信文字语音不对称产生的沟通不便问题。

非普通话与普通话互译方法、装置和设备-201910832539.6
发明人：丘春华;陈江湖 -专利权人：福建省立医院
申请日： 2019-09-04 - 公布日： 2019-11-08 - 主分类号： G10L15/00
摘要：本发明涉及一种非普通话与普通话互译方法、装置和设备。通过获取当前与普通话互译的语言类型、采集待翻译语音、利用预先训练好的语音识别模型，从所述待翻译语音中提取语音特征、以及根据提取的所述语音特征确定所述待翻译语音的语言类型，根据确定的所述待翻译语音的语言类型和提取的所述语音特征，识别所述待翻译语音对应的文本内容、若所述待翻译语音的语言类型为普通话，将所述待翻译语音的文本内容转换为当前与普通话互译的语言类型对应的文本内容、若所述待翻译语音的语言类型为当前与普通话互译的语言类型，将所述待翻译语音的文本内容转换为普通话对应的文本内容等步骤，完成非普通话与普通话之间的互译，有效促进医生与患者之间的沟通。

语音识别文本处理方法及系统-201510450586.6
发明人：占吉清;高建清;刘聪;王智国;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2015-07-24 - 公布日： 2019-10-18 - 主分类号： G10L15/00
摘要：本发明公开了一种语音识别文本处理方法及系统，该方法包括：获取待识别语音数据；对所述语音数据进行语音识别，得到所述语音数据对应的语音识别结果，所述语音识别结果为语音数据对应的识别文本；对所述语音数据进行异常语音检测，以确定所述语音数据中的异常语音；对所述识别文本中对应所述异常语音的部分进行标记；将标记后的识别文本提供给用户。利用本发明，可以自动检测出异常语音数据的识别文本并标记出来，提示用户，降低对用户的误导。

音视频字幕生成方法及装置-201510629172.X
发明人：周明;江源;王影;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2015-09-28 - 公布日： 2019-10-18 - 主分类号： G10L15/00
摘要：本发明公开了一种音视频字幕生成方法及装置，该方法包括：接收待生成字幕的语音数据及文本数据；根据发音人韵律对所述语音数据进行切分，得到符合说话人习惯的各语音数据段；根据所述语音数据段对所述文本数据进行切分，得到与所述语音数据段对应的文本数据段；根据各语音数据段的时间信息获取与所述语音数据段对应的文本数据段的开始时间和结束时间。本发明可以简单高效地实现文本数据的显示与语音数据的同步，使生成的字幕更完整。

语音翻译装置、语音翻译方法及记录介质-201910231608.8
发明人：林田亘平;坂口敦;野村和也;古川博基;西川刚树 -专利权人：松下电器产业株式会社
申请日： 2019-03-26 - 公布日： 2019-10-15 - 主分类号： G10L15/00
摘要：本发明提供语音翻译装置、语音翻译方法以及记录介质。语音翻译装置具备：波束成形部，根据由麦克风阵列部取得的语音信号，形成方向不同的第1波束和第2波束；方向指定部，通过用户的操作，指定第1波束及第2波束中的一方；信噪比计算部，将被指定的一方作为信噪比中的信号成分，将没有被指定的另一方作为噪声成分，计算信噪比；显示决定部，使用计算出的信噪比，判定被指定的一方的识别是否困难，在判定为困难的情况下，决定消除该困难的讲话方法；以及显示部，将由显示决定部决定的讲话方法显示在显示器上。

语音传输系统-201910191839.0
发明人：宫胁慎 -专利权人：阔利达软件有限公司
申请日： 2019-03-14 - 公布日： 2019-10-08 - 主分类号： G10L15/00
摘要：本发明提供能够不区分本国人以及外国人地使用无人机来传输必要消息的语音传输系统。本发明的语音传输系统具备：无人飞行器；操纵终端，其用于操纵该无人飞行器；以及信息终端，其经由网络能够访问下述的服务器，并能够从该服务器下载下述的语音数据，即，该服务器能够将由相应国家的官方语言制作出来的文本数据翻译成官方语言以外的指定的语言，并且提供将已翻译出来的所述文本数据转换为语音数据的服务。信息终端将从所述服务器下载下来的指定语言的语音数据发送给无人飞行器，该无人飞行器将所述指定语言的语音数据从安装于机体上的扬声器输出出去，来作为语音消息。

用于车辆中的语音检测的方言与语言识别-201910156239.0
发明人：约书亚·惠勒;阿赫麦德·阿巴特布尔;斯科特·安德鲁·安曼;约翰·爱德华·胡贝尔;利亚·N·布施;兰贾尼·兰加拉詹 -专利权人：福特全球技术公司
申请日： 2019-03-01 - 公布日： 2019-09-13 - 主分类号： G10L15/00
摘要：本公开提供了“用于车辆中的语音检测的方言与语言识别”。公开了用于车辆中的语音检测的方言与语言识别的方法和设备。示例性车辆包括传声器、通信模块、存储用于语音识别的声学模型的存储器，和控制器。所述控制器用于收集包括话音命令的音频信号，以及通过将所述音频信号应用于深度神经网络来识别所述话音命令的方言。所述控制器还用于在确定所述方言与任何所述声学模型不对应时，经由所述通信模块从远程服务器下载用于所述方言的选定的声学模型。

一种基于压缩感知的肝豆状核变性言语障碍的分类方法-201910494055.5
发明人：马春;汪庆;杜炜;阚红星 -专利权人：安徽中医药大学
申请日： 2019-06-08 - 公布日： 2019-09-06 - 主分类号： G10L15/00
摘要：本发明涉及一种基于压缩感知的肝豆状核变性言语障碍的分类方法，包括以下步骤：提出合理的WD患者语音信号的预处理方法；建立WD患者语音、图像、视频、病史及CT磁共振资料的数据库；获取针对WD患者言语障碍的语音特征参数的特征属性，并在现有词表的基础上构建更规范有效的专用型词表；提出可行的语音分类识别算法，实现病情等级的划分；研发能够满足临床实际应用要求的基于压缩感知的肝豆状核变性言语障碍的分类系统。

一种智能会议系统与移动设备的链接方法-201910388641.1
发明人：郝雁华;程国艮 -专利权人：中译语通科技股份有限公司
申请日： 2019-05-10 - 公布日： 2019-08-30 - 主分类号： G10L15/00
摘要：本发明提供了一种智能会议系统与移动设备的链接方法。智能会议系统通过网络与显示设备连接，智能会议系统用遥控器控制选项。通过遥控器将智能会议系统的同步会议功能打开，此时便在显示设备上出现会议系统识别码，连接至同一网络的参会人员移动手持设备扫描会议系统识别码，便可以同步连接至会议系统。通过该智能会议系统与移动设备，参会人员能够实时了解发言内容并作相应的记录，而且该系统能够完全代替人工翻译的工作，节约了会议成本。

一种基于语音识别的推荐方法、装置及介质-201910353861.0
发明人：廖锡光 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-04-29 - 公布日： 2019-08-23 - 主分类号： G10L15/00
摘要：本发明公开了一种基于语音识别的推荐方法、装置及介质，所述方法包括：获取目标用户输入的待识别语音数据；对所述目标用户进行鉴权，得到鉴权结果；当所述鉴权结果为用户首次使用时，基于所述待识别语音数据进行识别以得到对应的方言类型；根据所述方言类型，从待选用户群体中确定推荐用户；获取所述推荐用户的兴趣列表，根据所述推荐用户的兴趣列表为所述目标用户创建推荐列表。本发明确定目标用户为首次使用时，通过识别出目标用户输入的待识别语音数据的方言类型，利用方言类型确定推荐用户，再根据推荐用户的兴趣列表向目标用户做推荐。提高在用户首次使用场景下个性化推荐的准确性。

一种智能设备的控制方法、装置、设备及介质-201910371046.7
发明人：朱晚贺;杨鹏 -专利权人：北京猎户星空科技有限公司
申请日： 2019-05-06 - 公布日： 2019-08-20 - 主分类号： G10L15/00
摘要：本发明公开了一种智能设备的控制方法、装置、设备及介质，用以提高确定交互语言语种的效率，提高智能设备的智能化程度。所述智能设备的控制方法，包括：获取智能设备采集到的语音数据；利用预先训练的唤醒词识别模型对所述语音数据进行识别，确定出所述语音数据包含预设的唤醒词以及所述语音数据对应的目标语种；唤醒所述智能设备，并将所述目标语种确定为所述智能设备的交互语言对应的语种。

多语言语音辅助支持-201910007798.5
发明人： X·F·赵;R·阿卜杜勒莫拉;S·D·卡斯特 -专利权人：通用汽车环球科技运作有限责任公司
申请日： 2019-01-04 - 公布日： 2019-08-09 - 主分类号： G10L15/00
摘要：一个总体方面包括一种方法，包括：经由传感器从用户获得唤醒词；经由存储器获得与唤醒词的相应语言有关的唤醒词语言数据；经由处理器识别唤醒词的语言；基于唤醒词语言数据，从多个不同的语音助理中识别出具备最适合于唤醒词的语言技能的所选语音助理；并且促进与所选语音助理的通信，从而根据唤醒词提供语言辅助。本方面的其他实施例包括对应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序，每一者都配置成执行方法的动作。

音频同传方法、系统及计算机设备、计算机可读存储介质-201910340471.X
发明人：屈耕 -专利权人：数译（成都）信息技术有限公司
申请日： 2019-04-25 - 公布日： 2019-08-09 - 主分类号： G10L15/00
摘要：本申请公开了一种音频同传方法、系统及计算机设备、计算机可读存储介质。该音频同传方法包括通过第一声道接收第一输入端的发送的待翻译音频信号；发送所述待翻译音频信号至第一接收端；通过第二声道接收第二输入端的发送的同声翻译后的翻译音频信号；发送所述同声翻译后的翻译音频信号。本申请解决了传统同传时，由于同时需要部署多个同传设备而造成的部署繁琐且耗时的技术问题。

一种网络多语言社交翻译方法、系统、设备及介质-201910389958.7
发明人：都风忠 -专利权人：濮阳市顶峰网络科技有限公司
申请日： 2019-05-10 - 公布日： 2019-08-09 - 主分类号： G10L15/00
摘要：本发明公开了一种网络多语言社交翻译方法、系统、设备及介质，包括：实时获取用户在网络社交中的语音数据，并对所述用户使用的语种进行识别；根据识别的语种将所述语音数据转换成文字，同时根据所述用户的社交对象所使用的语种，将转换后的文字翻译成目标文字；将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。本发明解决不同语种人群社交时的沟通障碍问题，应用场景多样化，可满足一对多的沟通需求，有效提高社交效率，同时可协助用户及其社交对象相互学习语言。

一种会计语言识别信息录入装置-201910355212.4
发明人：侯燕;王婧 -专利权人：德州职业技术学院（德州市技师学院）
申请日： 2019-04-29 - 公布日： 2019-07-23 - 主分类号： G10L15/00
摘要：本发明属于语言识别技术领域，公开了一种会计语言识别信息录入装置，所述会计语言识别信息录入装置包括：语音录入模块、模板数据模块、监视检查模块、中央处理模块、显示模块、储存模块。本发明通过语音录入模块录入会计的发出的声音，并且通过中央处理模块将语音转化为模拟信号，将模拟信号转化为数字信号，数字信号和波形数据库形成对比，然后分拆成单个音位，最后根据音位查询字典库生生词语或句子，最终完成文字录入的工作。

用于输出信息的方法和装置-201910168741.3
发明人：田飞 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2019-03-06 - 公布日： 2019-06-28 - 主分类号： G10L15/00
摘要：本申请实施例公开了用于输出信息的方法和装置。上述方法的一具体实施方式包括：获取声音采集装置采集的音频；对上述音频进行语言识别，确定音频对应的语言种类；输出使用上述语言种类对应的语言的多媒体信息。该实施方式可以根据用户所使用的语言，向用户播放对应语言的多媒体信息，方便用户观看。

一种控制智能设备交互的方法及装置-201910205210.7
发明人：李宝祥;吕安超 -专利权人：北京猎户星空科技有限公司
申请日： 2019-03-18 - 公布日： 2019-06-28 - 主分类号： G10L15/00
摘要：本发明公开了一种控制智能设备交互的方法及装置，该方法包括确定智能设备与交互对象进行交互所需使用的目标语种；若目标语种与当前配置的语种不一致，控制智能设备使用目标语种与交互对象进行交互。通过先确定智能设备与交互对象进行交互所需使用的目标语种，可以实现面对不同语种的交互对象时，使用交互对象的语种与交互对象进行交互，从而可以实现与不同语种的用户进行交互，提供相应的服务。

语音对话系统、语音对话装置、用户终端以及语音对话方法-201780065619.2
发明人：广江厚夫;冈本拓磨;木俵丰 -专利权人：国立研究开发法人情报通信研究机构
申请日： 2017-11-06 - 公布日： 2019-06-14 - 主分类号： G10L15/00
摘要：以往，在用户与语音对话装置之间的一系列的对话进行了一定程度之后，该用户或者其他用户无法对过去的对话的状况进行确认等。本发明的跨语言的语音对话系统在配对服务器接收到来自用户终端的指示的情况下，存储在存储介质中的对话信息被发送至用户终端，根据该语音对话系统，在用户与语音对话装置之间的一系列的对话进行了一定程度之后，该用户或者其他用户能够确认或者认知过去的对话的状况。

一种用于多种方言识别的设备-201910055279.6
发明人：王大年 -专利权人：王大年;元任科技(上海)有限公司
申请日： 2019-01-21 - 公布日： 2019-06-07 - 主分类号： G10L15/00
摘要：一种用于多种方言识别的设备，包括连接于显示设备上的识别器本体；所述的识别器本体内置语音采集装置，所述的语音采集装置通过微控制器与方言识别模块连接；所述的方言识别模块具连接有方言词典和储存器；所述的方言识别模块还具有生僻词汇筛选模块，并与储存器相连；所述的储存器通过无线通信模块与云服务器连接。本发明通过词汇对比器，剔除无法在方言词典中匹配的方案词汇，将其单独储存，并上传至云端，在云服务器中进行人工翻译。整个识别、翻译过程高效，快捷，有效降低翻译误差。

声音激活的手术控制系统-201780034382.1
发明人：贾勒·阿塔罗特;莫蒂·弗里梅;塔尔·尼尔;利奥尔·阿尔珀特 -专利权人： M.S.T.医学外科技术有限公司
申请日： 2017-04-09 - 公布日： 2019-06-07 - 主分类号： G10L15/00
摘要：本发明提供了一种用于在手术设定中控制至少一个器械的声音激活控制系统。该控制系统包括：语音传感器，该语音传感器用以检测由位于手术设定中的至少一个外科医生生成的声音命令；信号发送器，该信号发送器可操作地连接到语音传感器，以将声音命令转换成可发送的声音信号并发送该可发送的声音信号；以及处理器，该处理器可操作地连接到信号发送器以接收该可发送的声音信号。处理器将可发送的声音信号转换成预确定的操作指令组的成员，其中每个操作指令与手术环境中的器械相关联。每个器械包括控制装置，控制装置可操作地连接到处理器和器械。控制装置接收操作指令并使器械相应地运行。

一种便携式英语口音识别装置-201910059286.3
发明人：王大年 -专利权人：王大年;元任科技(上海)有限公司
申请日： 2019-01-22 - 公布日： 2019-05-31 - 主分类号： G10L15/00
摘要：一种便携式英语口音识别装置，包括语音获取模块，还包括与服务器无线通信的方言识别数据库；所述的方言识别数据库从服务器下载各种英语方言版本；所述的英语数据库连接有口音对比模块；所述的口音对比模块用于对比每种英语方言与标准英语；所述的语音获取模块与对比模块相接。本发明通过口音对比模块，从服务器上下载某种英语方言模板，通过学习系统学习其与标准英语之间的各种差异，并储存和建立这种差异的数据库，当语音获取模块收集到外部语音数据时，进入上述的数据库，进行数据对比，并得出对比结论。

语音翻译器、方法、设备和存储介质-201910163565.4
发明人：周超群 -专利权人：深圳市尚可饰科技有限公司
申请日： 2019-03-05 - 公布日： 2019-05-31 - 主分类号： G10L15/00
摘要：本申请涉及一种语音翻译器、方法、设备和存储介质,其中语音翻译器，包括：壳体；设置于壳体内部的芯片主板，芯片主板上设置有电性连接的语音识别模块和语音信息转换模块，语音识别模块被配置为检测待输入的语音信息并进行语音识别；语音信息转换模块被配置为将语音识别后的语音信息转换为对应的译文信息；设置于壳体外部并与芯片主板电性相连的功能按键；设置于壳体一端并连接于芯片主板的外接接口，语音翻译器则通过外接接口与外部终端设备连接，以通过外部终端设备显示所述译文信息。本申请的语音翻译器可以通过功能按键控制芯片主板的工作状态，通过外接接口与外部终端设备连接，以通过外部终端设备显示译文信息，其操作简单，使用方便。

一种基于语种识别系统的语言距离关系的获取方法-201511005493.9
发明人：胡浩基;孙乐 -专利权人：浙江大学
申请日： 2015-12-28 - 公布日： 2019-05-31 - 主分类号： G10L15/00
摘要：本文公开发明了一种基于语种识别系统的语言距离关系的获取方法。包含语种识别过程和语言关系图生成过程。语种识别过程是指计算机根据未知说话人所讲的一段语音的声波信号来辨认所讲语音的语言种类的过程。语言关系图生成过程是指根据语言之间的识别率判定语言之间距离最终生成语言关系图的过程。本发明将一种新的语音特征集应用于语种识别系统，并通过GentleAdaBoost算法搭建语种识别系统，利用语种识别系统输出的语种识别率来研究语言之间的距离关系，不仅有效提高了语种识别率，而且取得了和实际基本一致的结果，为语言距离关系的研究提供了一种新的思路。

一种智能化跨语言语音识别转化方法-201910112299.2
发明人：葛星 -专利权人：安徽大尺度网络传媒有限公司
申请日： 2019-02-13 - 公布日： 2019-05-24 - 主分类号： G10L15/00
摘要：本发明公开了一种智能化跨语言语音识别转化方法，该智能化跨语言语音识别转化方法包括以下步骤：S1：语音收集，S2：语音识别，S3：语音转化，S4：语音识别判断。本发明设计巧妙，能够实现对语音进行识别转化，且本发明的方法方便对语音进行去噪处理，以保证语音的音质，方便不同区域的人们进行沟通交流，通过语音收集模块，方便对待识别的语音进行收集，以保证为语音转化提供前提条件；通过语音识别模块一和语音识别模块二，方便语音识别模块一先对语音进行识别判断，然后再通过语音识别模块二进行对语音转化后的判断属于那种语音语系，方便对语音分类储存，也方便其它设备进行访问语音数据库。

语音翻译终端、移动终端、翻译系统、翻译方法及其装置-201910173337.5
发明人：周庐 -专利权人：北京金山安全软件有限公司
申请日： 2019-03-07 - 公布日： 2019-05-14 - 主分类号： G10L15/00
摘要：本申请提出一种语音翻译终端、移动终端、翻译系统、翻译方法及其装置，其中，语音翻译终端包括：壳体、控制器、一个触发按键、传声器组、扬声器及通信组件；壳体形成空间用于容纳控制器、传声器组、扬声器及通信组件；一个触发按键设置在壳体上，传声器组用于在触发按键被触发后，采集第一语音信息；扬声器用于根据控制器的控制，播放第二语音信息；其中，第二语音信息为第一语音信息翻译后的语音信息；控制器用于控制通信组件向移动终端发送第一语音信息，控制通信组件接收由移动终端发送的第二语音信息。由此，用户无需在语音翻译终端上设置对应的按键来确定第一语音信息的语种，可以简化用户的操作步骤。

一种信息获取方法、装置、设备及存储介质-201811604272.7
发明人：李承敏;李兵 -专利权人：上海与德通讯技术有限公司
申请日： 2018-12-26 - 公布日： 2019-05-03 - 主分类号： G10L15/00
摘要：本发明公开了一种信息获取方法、装置、设备及存储介质。该方法包括：获取走失用户输入的目标方言语音信息；根据所述目标方言语音信息查询数据库，得到与所述目标方言语音信息相似度大于预设值的标记后的预存语音信息；获取所述标记后的预存语音信息对应的地址信息和沟通信息，通过本发明的技术方案，能够在不会说普通话的儿童或者老人走丢后，根据儿童或者老人说的方言联系到儿童或者老人的家人。

一种现场会议人工智能同传设备-201910142081.1
发明人：张岩;代同杰;熊涛 -专利权人：深圳市合言信息科技有限公司
申请日： 2019-02-26 - 公布日： 2019-04-26 - 主分类号： G10L15/00
摘要：本发明公开了一种现场会议人工智能同传设备，其中麦克风阵列可提高各个方向上的拾音能力，让会议桌各个方向说话都能被设备识别；回声消除模块可消除接收语音中的回声，噪声消除模块能够消除接收语音中的各种噪声，提高接收语音的清晰度；声纹识别模块能够通过声纹识别标记是哪个人说话，指明说话者的性别、年龄等特征；ASR语音识别模块能够将用户语音翻译成文字；自动判断语种模块能够将自动判断用户说话的语种，进而每一个人说话时都会翻译成会场各个语种所需要的翻译文字；神经网络翻译模块配合翻译库，给出参会对应国家语种翻译结果的文字，TTS播报模块能够将文字生成对应语种国家人的声音，进而播放出来，显示屏显示最终翻译的文字结果。

语言语义的音频交换方法和音频交换系统-201810264460.3
发明人：孔繁泽 -专利权人：孔繁泽
申请日： 2018-03-28 - 公布日： 2019-04-12 - 主分类号： G10L15/00
摘要：本发明的语言语义的音频交换方法、系统和音频编码图形，以解决现有技术中语言互译时因语义复杂导致数据响应出现差错和实时性差的技术问题。方法包括利用最小音素序列形成各语言的语音映射结构，通过各语音映射结构完成语义的语言间转换。利用语言构成中形成音频最小短段的最小音素作为各语言间语义转换的基本数据交换单元，利用最小音素作为数据交换的编码基础，改变了语音识别的基础结构，优化了语言中音频内容的编码复杂性和准确率，使得语言音频的编码过程中避免被耦合了语言片段中音调、音阶、音域等复合信息形成的复杂音频特征，保证了语音识别率。利用最小音素形成的语音编码与文字编码的映射结构使得语言翻译时的数据交换效率得到提高。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语种识别系统的语言距离关系的获取方法有效

专利文献下载