[发明专利]一种基于云端服务器的通信方法、系统及云端服务器在审

专利信息
申请号: 201810572185.1 申请日: 2018-06-06
公开(公告)号: CN110570863A 公开(公告)日: 2019-12-13
发明(设计)人: 徐婷婷;应宜伦 申请(专利权)人: 上海擎感智能科技有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/30;G03B21/56;G02B27/01
代理公司: 31219 上海光华专利事务所(普通合伙) 代理人: 徐秋平
地址: 200030 上海市徐汇*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于云端服务器的通信方法、系统及云端服务器,包括以下步骤:获取智能眼镜发送来的语音信息;将所述语音信息转换为文字信息;将所述文字信息发送至显示终端。本发明的基于云端服务器的通信方法、系统及云端服务器基于云端服务器的语音转换文字功能,使语音信息能够转换为文字信息便于沟通交流,可以达到及时获取由语音信息转化的文字信息的目的。
搜索关键词: 云端服务器 文字信息 语音信息 发送 沟通交流 文字功能 显示终端 语音转换 智能眼镜 音信息 转换 通信 转化
【主权项】:
1.一种基于云端服务器的通信方法,其特征在于,包括以下步骤:/n获取智能眼镜发送来的语音信息;/n将所述语音信息转换为文字信息;/n将所述文字信息发送至显示终端。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海擎感智能科技有限公司,未经上海擎感智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810572185.1/,转载请声明来源钻瓜专利网。

同类专利
  • 服务录音的合规检查方法及装置-201510500179.1
  • 陈云贵;聂湘平;王劲夫;刘辉;许美 - 上海银赛计算机科技有限公司
  • 2015-08-14 - 2020-02-14 - G10L15/26
  • 本发明公开了一种服务录音的合规检查方法及装置,属于通信技术领域。所述方法包括:根据目标客户的历史行为记录检测目标客户是否属于异常客户;若目标客户属于异常客户,则从呼叫中心获取与目标客户相关的服务录音;将服务录音转换为文本内容;根据文本内容检测服务录音是否符合服务规范;若不符合服务规范,则将服务录音和/或文本内容存储至目标位置。本发明解决了现有技术采用随机抽取的方式,存在大量漏检情况且效率低的问题;一方面充分减少了漏检情况发生,另一方面由于向质检人员提供的是被系统检测为不合规的服务录音,质检人员仅需对此进行复核即可,有助于质检人员有针对性地进行检查,提高检查效率。
  • 一种芯片平台离线语音检测控制系统-201920397324.1
  • 刘将 - 深圳君正时代集成电路有限公司
  • 2019-03-27 - 2020-02-14 - G10L15/26
  • 本实用新型公开了一种芯片平台离线语音检测控制系统,包括外壳和盖板,所述盖板固定安装于外壳顶端,所述外壳内部焊接有语音识别模块、语音降噪增强模块、中央处理器和文字转换模块,所述外壳外壁一侧上方通过螺丝安装有报警器,所述盖板上端表面镶嵌有麦克风和显示屏,所述麦克风与语音降噪增强模块之间电性连接;本实用新型通过设有的语音降噪增强模块,可有效实现对离线语音的检测,不会影响到人们的正常使用,并且可将正确的语音信息在显示屏上显示出来,可提供用户的观看,可帮助用户清晰直观的了解到正确的语音信息。
  • 端到端语音唤醒方法、装置及计算机设备-201810763704.2
  • 姚光超 - 北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司
  • 2018-07-12 - 2020-02-11 - G10L15/26
  • 本发明公开了一种端到端语音唤醒方法、装置及计算机设备,该方法包括:接收待检测语音;依次提取每个语音帧的声学特征;将提取的声学特征输入声学模型,得到所述声学模型输出的每个语音帧中各目标发音单元的概率;逐帧计算各目标发音单元的累积概率,并确定各目标发音单元的起始位置和结束位置;根据所述累积概率及起始位置和结束位置计算各目标发音单元的长度及平均概率;根据各目标发音单元的长度和/或平均概率进行唤醒操作。利用本发明,可以降低误唤醒率,提高唤醒效果。
  • 信息处理装置、存储介质及信息处理方法-201910279586.2
  • 铃木麻衣 - 富士施乐株式会社
  • 2019-04-09 - 2020-02-11 - G10L15/26
  • 一种信息处理装置、存储介质及信息处理方法,所述信息处理装置具备:获取单元,分别获取语音数据及静态图像数据;显示控制单元,以将通过所述获取单元获取的静态图像数据与所述语音数据同步显示的方式进行控制;接收单元,接收赋予于通过所述显示控制单元显示的静态图像数据内的特定文字并显示的显示要素;及设定单元,将在所述语音数据中播放所述特定文字的播放期间作为通过所述接收单元接收的显示要素的静态图像数据内的显示期间来设定。
  • 协作AI讲故事-201910608426.8
  • E·V·多格特;E·德雷克;B·哈维 - 迪斯尼企业公司
  • 2019-07-08 - 2020-02-11 - G10L15/26
  • 本申请公开了协作AI讲故事。本公开的实施方式描述了AI系统,其提供可以与用户协作地交互的即兴讲故事AI代理。在一个实施方式中,实施讲故事设备可以使用i)自然语言理解(NLU)组件来处理人类语言输入(例如,数字化语音或文本输入)、ii)自然语言处理(NLP)组件以将人类语言输入解析为故事片段或序列、iii)用于存储/记录通过协作创建的故事的组件、iv)用于生成AI建议的故事元素的组件以及v)自然语言生成(NLG)组件以将AI生成的故事片段转换为可以呈现给用户的自然语言。
  • 一种基于时延神经网络的声控设备唤醒词识别方法及装置-201910884254.7
  • 刘博卿;王健宗;贾雪丽 - 平安科技(深圳)有限公司
  • 2019-09-19 - 2020-02-07 - G10L15/26
  • 本发明公开了一种基于时延神经网络的声控设备唤醒词识别方法及装置,其中,本发明的一种基于时延神经网络的声控设备唤醒词识别方法,包括:对待识别的语音数据进行多维Fbank特征提取,将提取到的多维Fbank特征送入预先训练好的唤醒词识别模型中进行识别,并输出识别结果,判断识别结果中的唤醒词的后验概率是否大于预设阈值,若是,则确认待识别的语音数据中包括唤醒词。因为相比传统的神经网络大大减少了需要计算的数据量,且识别模型只需要对唤醒词进行精准识别和训练,故而具有判断准确率高且识别速度快的优点,能够有效提高用户体验,使用户说出唤醒词会能够快速唤醒声控设备,防止因唤醒失败或唤醒速度慢降低用户体验。
  • 一种语音转换系统及方法-201911042474.1
  • 陈阳;鲁永春;王周 - 合肥名阳信息技术有限公司
  • 2019-10-30 - 2020-02-07 - G10L15/26
  • 本发明公开了一种语音转换系统及方法,属于语音转换技术领域,包括录音模块、语音转文字模块、文字转语音模块、配音模块、字幕模块和存储模块;所述语音转文字模块用于将语音信息转换成文字信息;所述文字转语音模块用于将文字信息转换成语音信息;所述配音模块用于将语音信息处理为语音文件;其方法如下:S1:录制声音并存储为录音音频文件;S2:将步骤S1中录音音频文件转换成文字信息;S3:将步骤S2中文字信息转换成语音信息;S4:将步骤S3中语音信息进行处理并转化成音频文件;S5:将步骤S1中文字信息转换成字幕文件;S6:存储并播放步骤S3中的音频文件和字幕文件。本方案实现普通话与方言转换、停顿控制和同步字幕显示。
  • 基于语音识别和语义识别的课堂教学警示矫正系统及方法-201911020260.4
  • 涂勇;朱杏杏 - 重庆晋才富熙科技有限公司
  • 2019-10-25 - 2020-02-04 - G10L15/26
  • 本发明公开了一种基于语音识别和语义识别的课堂教学警示矫正系统,包括:包括声音采集模块、语音识别模块、语义识别模块;分析矫正模块,具有存储功能,分析矫正模块存储有规范语言标准库,规范语言标准库中包含不良言语库或不恰当言论库;分析矫正模块用于接收所述语音文本信息和所述语义文本信息,并将所述语音文本信息和所述语义文本信息和规范语言标准库进行比对,如果所述语音文本信息或所述语义文本信息中包含有不良言语或不恰当言论,向警示模块发出控制信号;警示模块,用于当接收到控制信号后向教师发出警示提醒。本发明当教师在教学过程中,产生不良的言语和不恰当的言论时,自动对教师警示,提醒教师加以矫正。
  • 一种车用语音控制装置-201920272259.X
  • 朱书民;唐照斌;高威;汤小生 - 浙江吉利汽车研究院有限公司;浙江吉利控股集团有限公司
  • 2019-03-04 - 2020-02-04 - G10L15/26
  • 本实用新型提供了一种车用语音控制装置,属于汽车技术领域。它解决了现有的技术在语音操控后,驾驶人员无法确认控制器识别的语音是否准确,存在语音输入准确性不足的问题。本车用语音控制装置包括内饰灯、MCU控制单元、显示器和用于对语音信息进行采集的语音采集单元,语音采集单元与MCU控制单元的输入端连接,内饰灯和显示器均与MCU控制单元的输出端连接,MCU控制单元用于对语音采集单元输送的语音信息进行识别以及用于产生相应的控制指令信号,内饰灯用于根据接收的相应的控制指令信号实现开关和亮度调节,显示器用于根据接收的相应的控制指令信号实现对内饰灯相应状态的显示。本控制装置能够提高语音输入的准确性。
  • 一种基于机载设备的数字串语音识别方法-201410701895.1
  • 李曜 - 上海航空电器有限公司
  • 2014-11-28 - 2020-01-31 - G10L15/26
  • 本发明公开了一种基于机载设备的数字串语音识别方法,在识别阶段采用两遍识别的框架对带有数字串的语音做二次确认,在二次确认过程中使用数字专用模型进行识别,从而提升数字串的识别准确率。在结果确认阶段采用局部语音重新输入的方式修改识别错误的数字串,通过减少识别内容的方式提高输入内容全部被正确识别的概率,减少修改识别错误的操作时间。本发明通过改善数字串识别性能和优化修改错误识别结果的人机交互流程,尽可能减少飞行员低头在触摸显示屏上操作数字串输入的时间,从而提升飞行安全保障,减轻飞行员操控负荷。
  • 一种信息显示方法、装置、设备及可读存储介质-201810777950.3
  • 金超;翟吉博 - 科大讯飞股份有限公司
  • 2018-07-16 - 2020-01-24 - G10L15/26
  • 本申请公开了一种信息显示方法、装置、设备及可读存储介质,本申请能够根据输入的语音数据及对应的识别文本数据,确定对象在输入语音时的情绪信息,通过确定的情绪信息可以匹配对应的文本显示模式,进而能够控制识别文本数据按照匹配的文本显示模式进行显示,由于该显示的文本已经是按照用户情绪匹配的显示模式进行显示的,因此无需用户再次对显示的文本进行编辑操作,简化了操作步骤且提高了输入效率。
  • 一种信息处理方法和电子设备-201710866956.3
  • 夏伟成 - 维沃移动通信有限公司
  • 2017-09-22 - 2020-01-21 - G10L15/26
  • 本发明提供一种信息处理方法和电子设备,其中方法包括:若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息进行转换后的目标文字信息对应显示。检测到语音转换指示,即可将至少两条语音信息均转换成文字信息并对应显示,简化了电子设备的信息处理操作,达到了优化电子设备的信息处理操作流程的技术效果。
  • 一种语音识别方法、装置、电子设备及存储介质-201810663096.8
  • 张鹏 - 普天信息技术有限公司
  • 2018-06-25 - 2020-01-17 - G10L15/26
  • 本发明实施例提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:获取待识别语音数据;根据预先训练得到的神经网络识别模型,对所述待识别语音数据进行语音识别,得到与所述待识别语音数据对应的识别文字,其中,所述神经网络识别模型对预设语音语料库中语音的说话人的识别率小于或等于预设阈值,所述预设语音语料库用于训练得到所述神经网络识别模型。本发明实施例提高了神经网络识别模型对待识别语音进行识别时的准确率。
  • 用于在电子装置中执行语音命令的方法和设备-201611043404.4
  • 萨博豪吉特·查克拉德;李相勋;金凞云 - 三星电子株式会社
  • 2013-05-29 - 2020-01-17 - G10L15/26
  • 提供一种用于在电子装置中执行语音命令的方法和设备。在示例性实施例中,检测语音信号并识别语音信号的言语。当识别的言语包含唤醒命令时,语音命令模式被激活,并且至少包含检测到的语音信号的一部分的信号被发送到服务器。服务器产生与语音命令相应的控制信号或结果信号,并将所述控制信号和结果信号发送到电子装置。所述装置接收和处理控制信号或结果信号,并被唤醒。从而,在不需要用户物理地触摸电子装置的情况下执行语音命令。
  • 语音识别方法及装置-201610389407.7
  • 吴刚;党君利;柳义庆;冯晓龙 - 深圳市智物联网络有限公司
  • 2016-06-02 - 2020-01-17 - G10L15/26
  • 本发明公开了语音识别方法及装置,为不同的服务界面设置了不同的操作指令模板,以当前服务界面对应的操作指令模板为准,判断接收到的语音信息是否与该操作指令模板匹配,若匹配成功,才执行语音信息指示的操作,从而避免在存在多重声音时,将输入的近似语音信息作为操作指令,打断当前正在提供的服务,做到准确识别语音信息中的操作指令内容。
  • 一种基于公众显示装置的语音交互方法以及设备-201911142663.6
  • 李建明;李贵平 - 广东奥园奥买家电子商务有限公司
  • 2019-11-20 - 2020-01-14 - G10L15/26
  • 本发明公开了一种基于公众显示装置的语音交互方法以及设备。其中,所述方法包括:公众显示装置获取用户的语音,和将该获取的用户的语音转换为对应的文字信息,和检测该转换得到的文字信息中是否包括预设的关键词得到检测结果,和根据该得到的检测结果,确定用户的意图,以及根据该确定的用户的意图,通过语音对用户进行交互响应。通过上述方式,能够实现公众显示装置能够通过获取用户的语音来确定用户的意图并作出语音应答的拟人化交互。
  • 一种手腕式智能语音遥控器-201920066728.2
  • 朱泽友 - 广州捷芯科技有限公司
  • 2019-01-15 - 2020-01-14 - G10L15/26
  • 本实用新型公开了一种手腕式智能语音遥控器,包括手腕佩戴套件,所述手腕佩戴套件内设有语音控制功能模块和红外遥控功能模块,所述语音控制功能模块包括通讯模块、拾音模块和语音识别芯片,所述红外遥控功能模块包括红外发射模块和按键模块,所述拾音模块的输出端和按键模块的输出端均连接语音识别芯片的输入端,所述语音识别芯片的输出端分别连接通讯模块的输入端和红外发射模块的输入端。本实用新型将语音控制功能模块和红外遥控功能模块集成到手腕佩戴套件中,实现了语音遥控功能,能够方便老年人操作,实用性强;另外,本实用新型的遥控器采用手腕式设计,便于用户携带,不易丢失,可广泛应用于遥控器技术领域。
  • 文本编辑方法及装置-201810609449.6
  • 丁峰 - 研祥智能科技股份有限公司
  • 2018-06-13 - 2020-01-07 - G10L15/26
  • 本发明提供一种文本编辑方法。所述方法包括:采集用户输入的语音信号,并将所述用户输入的语音信号保存为音频文件;通过后台数据库对所述音频文件进行方言分类,将所述音频文件翻译成对应方言的文本,并将所述对应方言的文本替换为标准普通话文本;将所述标准普通话文本写入文本文件中。本发明通过在现有的文本编辑工具中增加语音识别功能,且所增加的语音识别功能能够识别多种地方方言,从而能够提高文本编辑效率。
  • 一种会话过程记录系统及方法-201910865011.9
  • 宋圣涛 - 北京左医科技有限公司
  • 2019-09-09 - 2020-01-03 - G10L15/26
  • 本发明属于语音信息处理领域,公开了一种会话过程记录系统及方法,所述系统包括终端设备、多个语音采集装置和服务器,各所述语音采集装置适于同时采集多段语音信息并相应形成多个音频文件,各所述音频文件通过所述终端设备发送至所述服务器,通过语音识别SDK将所述音频文件中的语音信息转换成文字信息,所述文字信息存入所述服务器并反馈至所述终端设备。本发明通过将同时采集的多段语音信息转换成文字信息,实现多角色会话过程的实时记录,以满足多人会话特定场景的应用需求。
  • 一种语音控制方法、装置和终端设备-201610271400.5
  • 张大钊;崔保磊;朱文菲 - 海信集团有限公司
  • 2016-04-28 - 2020-01-03 - G10L15/26
  • 本发明公开了一种语音控制方法、装置和终端设备,涉及语音控制技术领域,旨在简化终端设备的语音控制过程,提高终端设备的语音控制响应速度和准确率,进而提高终端设备的用户体验性。该方法包括:当终端设备被触发进入语音控制模式后,接收输入的语音数据,并根据所述语音数据获取对应的语音文本;将所述语音文本与当前操作界面对应的界面词列表进行匹配,其中,所述界面词列表包括当前操作界面的文字信息;若所述语音文本与所述界面词列表匹配成功,获取所述语音文本在当前操作界面中对应的操作链接;根据所述操作链接执行所述操作。
  • 一种语音处理方法及设备-201810643241.6
  • 鄢志杰;严念念 - 阿里巴巴集团控股有限公司
  • 2018-06-21 - 2019-12-31 - G10L15/26
  • 本申请实施例公开了一种语音处理方法及设备。所述方法包括:获取语音录制设备同时录制的多路语音信号;对所述多路语音信号分别进行语音识别处理,得到对应的多个文本信息;分别提取所述多路语音信号的音频特征、视觉特征以及对应的所述多个所述文本信息的文本特征;基于所述音频特征、所述视觉特征以及所述文本特征,确定所述多路语音信号中的有效语音信号。利用本申请提供的语音处理方式进行语音识别,可以提高智能语音识别的准确性。
  • 一种音频文件生成方法及装置、终端设备-201810028134.2
  • 李丹 - 广东小天才科技有限公司
  • 2018-01-11 - 2019-12-31 - G10L15/26
  • 本发明实施例涉及音频处理技术领域,公开了一种音频文件生成方法及装置、终端设备,该方法包括:录制外部人声以获得声音文件;将声音文件转换成文本内容;对该文本内容进行语义分析,以获得声音文件对应的情感特征;以该情感特征为依据,获取声音文件相适配的背景音乐和音效;对声音文件添加背景音乐和音效,获得音频文件;实施本发明实施例,结合声音文件的情感特征给以声音文件添加背景音乐和音效,以提高音频文件的听觉感受。
  • 一种语音识别的方法及装置-201910807084.2
  • 余文胜;何建文;叶和兴;李轩 - 深圳市梦网科技发展有限公司
  • 2019-08-29 - 2019-12-27 - G10L15/26
  • 本申请适用于语音识别技术领域,提供了一种语音识别的方法及装置,包括:获取待识别语音对应的第一文字内容;将所述第一文字内容进行注音得到第一拼音,根据所述第一拼音在预存数据库中进行检索;当检索到第一相同内容时,则将所述第一文字内容作为输出结果;当未检索到第一相同内容时,则将所述第一拼音中易混拼音进行替换得到第二拼音或将所述第一拼音首位或末位汉字的拼音删除得到第三拼音,根据所述第二拼音或第三拼音在预存数据库中进行检索。本申请通过上述方式实现对语音识别结果进行二次检索处理,提高了语音识别技术的识别率。
  • 车载语音控制方法及装置-201510086619.3
  • 陈克清;刘凯 - 上海汽车集团股份有限公司
  • 2015-02-17 - 2019-12-27 - G10L15/26
  • 一种车载语音控制方法及装置,方法包括:建立第一语音和控制指令的对应关系,第一语音包括存储于第一语音样本库中的自定义的语音信息,所述第一语音样本库存储于车辆的车载存储单元中;获取第二语音,第二语音为由用户输入的语音信息;若在第一语音样本库中含有与第二语音相匹配的第一语音,将对应第一语音的控制指令传输到车载电子控制装置,以实现对车辆的控制操作。该方法实现由用户自定义语音训练样本,实现语音样本的个性化定制,提升车载语音控制系统的语音识别率;由于用户可以自定义语音样本,减少在语音样本库中匹配不到用户输入的语音信息的情况,减少与后台云计算服务器的交互,减少语音控制系统的响应时间,提高系统性能。
  • 用于操作智能终端的方法和装置-201811053045.X
  • 熊芩;程高飞;高磊磊;王飞;刘悦;董文林 - 百度在线网络技术(北京)有限公司
  • 2018-09-10 - 2019-12-24 - G10L15/26
  • 本申请实施例公开了用于操作智能终端的方法和装置。该用于操作智能终端的方法包括:将当前输入的用户语音指令解析为当前文本指令;从历史用户语音指令集合对应的历史文本指令记录集合中,查询匹配当前文本指令的历史文本指令记录;解析查询到的历史文本指令记录,得到用户意图;向资源库发送基于用户意图生成的用户请求;基于资源库返回的响应和用户意图,指令动作组件动作。该方法应用到语音智能设备后,降低了用户使用成本。完善智能设备用户体验,提升智能语音的体验口碑,促进AI技术的产品化落地。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top