[发明专利]对言语数据进行匿名化在审
申请号: | 202310056005.5 | 申请日: | 2023-01-20 |
公开(公告)号: | CN116504217A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 大卫·迈克尔·赫尔曼;A·G·尚库 | 申请(专利权)人: | 福特全球技术公司 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L25/30 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;陈黎明 |
地址: | 美国密歇根*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 言语 数据 进行 匿名 | ||
本公开提供了“对言语数据进行匿名化”。一种计算机包括处理器和存储器,并且所述存储器存储指令,所述指令可由所述处理器执行以:接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。
技术领域
本公开涉及用于对言语数据进行匿名化的系统和技术。
背景技术
许多现代车辆包括语音识别系统。这种系统包括传声器。所述系统将由传声器检测到的口头词语转换成文本或可以与命令匹配的另一种形式。所识别的命令可以包括调整气候控制、选择要播放的媒体等。
发明内容
本文描述的系统和技术可以对言语数据进行匿名化。对言语数据进行匿名化可以防止语音识别系统基于分析言语来识别说话者。具体地,该系统可以接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。因此,第二言语数据是匿名化的。此外,该系统可以保留言语数据的非识别特性,诸如内容和语音风格,例如语速、音量、音高、口音等。
一种计算机包括处理器和存储器,并且所述存储器存储指令,所述指令可由所述处理器执行以:接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。
所述指令还可以包括用于根据第一言语数据来确定文本的指令。所述指令还可以包括用于基于所述第一言语数据的至少一个片段的所述文本在某个类别中而移除所述至少一个片段的指令。在移除所述第一言语数据的所述至少一个片段之后生成所述第二言语数据可发生。
所述类别可以是个人可识别信息。
所述指令还可以包括用于将所述第二言语数据传输到远程服务器的指令。所述指令还可以包括用于将随机矢量传输到远程服务器的指令。
第一言语数据可以包括语音命令。所述指令还可以包括用于基于语音命令来致动车辆的部件的指令。
生成所述随机矢量可以包括根据所述说话者识别特性的分布来进行采样。所述分布可源自对来自说话者群体的所述说话者识别特性的测量。
第一矢量可以包括语谱图。语谱图可以是梅尔语谱图。
从所述第一言语数据中移除所述第一矢量可包括对不具有所述第一矢量的所述第一言语数据进行编码以生成所述提取的第一言语数据。对不具有第一矢量的第一言语数据进行编码可以包括执行机器学习程序。机器学习程序可以是使用下采样的卷积神经网络。
将所述随机矢量应用于所述提取的第一言语数据可包括使用所述随机矢量对所述提取的第一言语数据进行解码。对提取的第一言语数据进行解码可以包括执行机器学习程序。机器学习程序可以是使用上采样的卷积神经网络。
一种方法包括接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。
附图说明
图1是示例性车辆的框图。
图2是示例性言语数据的表示。
图3是用于对言语数据进行匿名化的机器学习程序的示例性集合的图示。
图4是用于对言语数据进行匿名化的示例性过程的过程流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福特全球技术公司,未经福特全球技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310056005.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:粘合膜、层叠体及粘合膜的使用方法
- 下一篇:晶片封装体及其制造方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置