[发明专利]用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质有效
申请号: | 201911020246.4 | 申请日: | 2015-04-22 |
公开(公告)号: | CN110675866B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 金玟澈 | 申请(专利权)人: | 纳宝株式会社 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/02;G10L15/08;G10L25/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 崔龙铉;王璇 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 改进 至少 一个 语义 单元 集合 方法 设备 计算机 可读 记录 介质 | ||
本发明提供一种用于改进至少一个语义单元的集合的方法、系统和计算机可读记录介质。根据本发明,可通过使用语声或文本来改进至少一个语义单元的集合。
本申请是申请号为201580000567.1,申请日为2015年4月22日,发明名称为“用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质”的专利申请的分案申请。
技术领域
本发明涉及一种用于通过使用语声来改进至少一个语义单元集合(下文中简称为“语义单元”)的方法、设备及计算机可读记录介质。
相关申请的交叉引用
本申请请求韩国申请No.10-2014-0048315和韩国申请No.10-2014-0077056的权益,其公开内容通过引用整体并入于此。
背景技术
已经尝试识别人类的语音并将所识别的语音转换为语义单元的标准集合(即,包括至少一个语义单元的集合)。这种语义单元集合可输出为与指定语言对应的数字语声,或者可书写为指定语言的文本。在前一种情况下,该语义单元集合可为作为模拟语声的分析结果的数字语声,模拟语声分析是一种扩展的语音识别;而在后一种情况下,该语义单元集合可为作为有限(narrow)的语音识别的结果的语音识别文本。
然而,根据前述尝试获得的语义单元集合在品质方面有一定的局限性。例如,人们各种各样的惯用语习惯、一些人的发音不清楚、不存在于字典中的词汇和地域方言的使用、包括噪音的周围环境等实质上使得难以根据语音识别技术获得语义单元集合。
由此,本申请的发明人提出了一种通过使用改进的语声(即,为了改进而单独说出的语声)来改进至少一个语义单元集合从而获得优良品质的语义单元集合的新技术。
在此,作为通过改进的语声而实现的改进目标,语义单元集合不必局限于通过语音识别技术获得。例如,作为改进目标的语义单元集合可为初始以文本输入的集合(即,其可能不是基于语音识别技术获得的语义单元集合)。
相反地,即使是在作为改进目标的语义单元集合为基于语音识别技术而获得的集合的情况下,为了改进该语义单元集合,也可设想到使用改进的文本而不是改进的语声。
本申请的发明人还提出了一种可用于上述各种情况的新技术。
在本背景技术部分中公开的上述信息仅用于加强对本发明的背景技术的理解,因此,其可能包含不构成在本国对于本领域技术人员而言已知的现有技术的信息。
发明内容
(一)技术问题
技术主题
本发明致力于解决相关领域的所有问题。
本发明还致力于通过使用语声或文本来改进至少一个语义单元集合。
本发明还致力于简单地并且精确地改进语音识别的结果。
本发明还致力于简单地并且精确地改进文本输入的结果。
(二)技术方案
根据下文中描述的本发明,可通过改进的语声来改进包括至少一个语义单元的集合,无论该集合是不是通过预定的电子装置(未示出)识别人类的模拟语音而获得的数字语声或文本结果,或者无论该集合是不是通过电子装置(未示出)输入(例如,通过键盘或按键输入)并且随后基于文本到语音(TTS)技术输出的数字语声,或者无论该集合是不是经输入并且随后被显示在屏幕上的文本。这种改进的方面可包括语音识别结果的校正或在经输入后被显示的文本中的打字错误的校正。
同时,根据下文中描述的本发明,可通过改进的文本来改进包括至少一个语义单元的集合,这种情况下该集合是通过预定的电子装置(未示出)识别人类的模拟语音而获得的数字语声或文本结果。作为这种改进的一方面,可包括语音识别结果的校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纳宝株式会社,未经纳宝株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911020246.4/2.html,转载请声明来源钻瓜专利网。