[发明专利]采用深度学习的名称实体识别在审
申请号: | 202080024080.8 | 申请日: | 2020-03-23 |
公开(公告)号: | CN113853606A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | J.伊索-西皮拉;F.A.克鲁格;A.萨法里;T.托吉亚 | 申请(专利权)人: | 伯耐沃伦人工智能科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了用于识别文本语料库中的实体的系统、方法和装置。该系统包括:第一命名实体识别(NER)系统,其包含一个或多个实体词典,所述第一NER系统被配置为基于一个或多个实体词典识别文本语料库中的实体和/或实体类型;第二NER系统,其包含被配置用于预测所述文本语料库内的实体和/或实体类型的NER模型;以及比较模块,其被配置为基于比较从第一和第二NER系统输出的实体结果来识别实体,其中被识别的实体与由第一NER系统识别的实体不同。该系统还可以包括更新模块,该更新模块被配置为基于被识别的实体更新一个或多个实体词典。该系统还可以包括词典构建模块,该模块被配置为至少基于被识别的实体构建一组实体词典。该系统还可以包括训练模块,其被配置为通过训练机器学习ML技术来生成或更新NER模型以使用基于代表所识别实体和/或实体类型的数据的训练数据集从文本语料库预测实体和/或实体类型。 | ||
搜索关键词: | 采用 深度 学习 名称 实体 识别 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伯耐沃伦人工智能科技有限公司,未经伯耐沃伦人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202080024080.8/,转载请声明来源钻瓜专利网。
- 上一篇:图像数据获得方法
- 下一篇:带有反向旋转的下端的弯曲壳体钻探马达
- 同类专利
- 用于聊天机器人会话的实体解析-202180070225.2
- 杨欣怡;谢天;熊蔡明;刘文昊;王欢;瞿金;S·兰卡;海楚红;叶旭刚;吴飞鸿 - 硕动力公司
- 2021-01-16 - 2023-09-15 - G06F40/295
- 系统使用被定制用于执行任务集合的聊天机器人来执行与用户的会话。系统可以是允许针对每个租户定制聊天机器人的多租户系统。该系统接收将任务映射到实体类型的任务配置以及指定用于确定特定实体类型的实体的方法的实体配置。系统接收用户话语并且使用意图检测模型,例如神经网络,来确定用户的意图。意图表示用户正在请求的任务。系统确定与任务相对应的一个或更多个实体。系统基于所确定的意图和实体来执行任务,并基于任务来执行与用户的会话。
- 通过终身学习的电子商务中可扩展标签学习的系统和方法-202180076286.X
- 单华松;周辉 - 北京沃东天骏信息技术有限公司;京东美国科技公司
- 2021-10-27 - 2023-07-14 - G06F40/295
- 终身标签学习的系统和方法。系统包括计算设备,其具有处理器和存储计算机可执行代码的存储设备。计算机可执行码用于:提供产品描述和表征产品的种子标签;使用产品描述和种子标签训练命名实体识别(NER)模型;使用NER模型从产品描述中预测伪标签;计算伪标签的置信度得分;将置信度得分与阈值比较,当伪标签的置信度得分大于阈值时,将伪标签定义为真标签;将真标签添加到种子标签以获得更新的标签;使用产品描述和更新的标签重复训练、预测、计算、比较和添加的步骤,以保持对更新的标签的更新。
- 用于自动语音识别(ASR)的上下文拼写校正(CSC)-202180052809.7
- 王晓强;刘砚清;赵晟;李锦宇 - 微软技术许可有限责任公司
- 2021-06-15 - 2023-05-02 - G06F40/295
- 用于语音识别的新颖解决方案提供了用于自动语音识别(ASR)的上下文拼写校正(CSC)。所公开的示例包括:接收音频流;对该音频流执行ASR处理以产生ASR假设;接收上下文列表;以及至少基于该ASR假设和该上下文列表来执行拼写校正以产生输出文本序列。在ASR模型之上使用上下文拼写校正(CSC)模型,这排除了改变原始ASR模型的需要。这准许基于上下文数据的运行时用户定制,即使对于大型上下文列表也是如此。一些示例包括过滤针对音频流的ASR假设,并且至少基于ASR假设过滤来确定是否要触发针对该ASR假设的拼写校正。一些示例包括使用具有上下文短语的经预处理转录来生成文本到语音(TTS)音频,以训练CSC模型。
- 通过不同应用的不相似消息传递特征来促进通信的自动化助理-202180039196.3
- 维克托·克尔布内;马修·谢里菲 - 谷歌有限责任公司
- 2021-11-22 - 2023-02-03 - G06F40/295
- 实施方式涉及能够响应经由第三方应用和/或其他第三方通信模态接收的通信的自动化助理。自动化助理能够确定用户正在经由多个不同第三方通信服务参与多个不同对话。在一些实施方式中,能够处理对话以识别对话的特定特征。当调用自动化助理来提供对对话的输入时,自动化助理能够将输入与所识别的对话特征进行比较,以便选择与输入最相关的特定对话。以这种方式,自动化助理能够协助各自经由不同第三方应用发生的多个不同对话中的任一个。
- 信息处理装置、信息处理方法以及程序-202080082266.9
- 市村由美;石井健弘 - 株式会社东芝;东芝数字解决方案株式会社
- 2020-11-26 - 2022-07-12 - G06F40/295
- 即使在不存在与预先定义的项目名一致的表达的情况下,也能够确定对项目值进行设定的插槽。实施方式的信息处理装置具备:分割部,其将第一关键词分割为第一单词,并将语句分割为第二单词;提取部,其从所述语句中提取在开头包含与所述第一关键词的开头的所述第一单词一致的所述第二单词的单词列以及在末尾包含与所述第一关键词的末尾的所述第一单词一致的所述第二单词的单词列中的至少一方;以及检测部,其基于表示所述单词列与所述第一关键词的文字的相似性的文字相似度以及表示所述单词列的构成与所述第一关键词的构成的相似性的构成相似度中的至少一方,检测第二关键词。
- 当自动助理正在对精简自然语言输入做出响应时偏置内容的供应的基于位置的模式-201980098125.3
- 莎伦·斯托维基;亚里夫·阿丹;拉杜·沃罗内亚努;贝沙德·贝扎迪;拉格纳·格鲁特·科尔卡匹;马尔钦·诺瓦克-普日戈兹基 - 谷歌有限责任公司
- 2019-09-10 - 2022-03-01 - G06F40/295
- 本文中阐述的实施方式涉及一种根据各种不同的基于位置的偏置模式操作以便为用户渲染响应内容和/或为用户预先主动地建议内容的自动助理。用户能够在自动助理正在根据一种或多种基于位置的偏置模式操作时向自动助理提供精简口语话语,但仍然接收来自自动助理的准确的响应输出。响应输出通过朝向已经优先于位置特性数据的其他子集的位置特性数据的子集偏置来生成。偏置允许自动助理补偿可能从口语话语中遗漏的任何细节,但是允许用户提供更短的口语话语,从而在处理来自用户的输入时减少语言处理的量。
- 自然语言处理系统、自然语言处理方法以及自然语言处理程序-201980097045.6
- 田方笃志 - 株式会社机器人之心
- 2019-11-08 - 2022-01-28 - G06F40/295
- 自然语言处理系统具有:场景设定部(10),其解析输入的自然语言的语句,生成表示理解自然语言的主体的主体数据、以及表示主体行动的世界的一部分的场景数据,在场景数据中设定主体数据;状况变化设定部(11),其解析输入的自然语言的语句,并设定场景的状况变化;正负情绪设定部(12),其基于场景的状况变化,判定是否产生了对于主体而言有利的情绪即正情绪、或者对于主体而言不利的情绪即负情绪;以及含义解析部(13),其基于产生的正负情绪进行含义解析。状况变化设定部(11)将在状况变化的前状态下作用于主体数据的价值和在状况变化的后状态下作用于主体数据的价值分别作为数值来获取。正负情绪设定部(12)计算前状态的数值与后状态的数值的差而计算出正负情绪。
- 采用深度学习的名称实体识别-202080024080.8
- J.伊索-西皮拉;F.A.克鲁格;A.萨法里;T.托吉亚 - 伯耐沃伦人工智能科技有限公司
- 2020-03-23 - 2021-12-28 - G06F40/295
- 提供了用于识别文本语料库中的实体的系统、方法和装置。该系统包括:第一命名实体识别(NER)系统,其包含一个或多个实体词典,所述第一NER系统被配置为基于一个或多个实体词典识别文本语料库中的实体和/或实体类型;第二NER系统,其包含被配置用于预测所述文本语料库内的实体和/或实体类型的NER模型;以及比较模块,其被配置为基于比较从第一和第二NER系统输出的实体结果来识别实体,其中被识别的实体与由第一NER系统识别的实体不同。该系统还可以包括更新模块,该更新模块被配置为基于被识别的实体更新一个或多个实体词典。该系统还可以包括词典构建模块,该模块被配置为至少基于被识别的实体构建一组实体词典。该系统还可以包括训练模块,其被配置为通过训练机器学习ML技术来生成或更新NER模型以使用基于代表所识别实体和/或实体类型的数据的训练数据集从文本语料库预测实体和/或实体类型。
- 实体识别的方法和装置、建立词典的方法、设备、介质-202080000047.1
- 代亚菲 - 京东方科技集团股份有限公司
- 2020-01-20 - 2021-11-09 - G06F40/295
- 一种命名实体识别的方法包括:获取目标文本(S101);根据预设的条件随机场模型确定目标文本中的待分类词及其词性分类(S102);条件随机场模型包括义原函数和模板函数;每个模板函数用于给出目标文本中的每个字对应每个词性分类的得分;义原函数用于将目标文本中的至少部分词与预设的义原库中的义原匹配,并在词具有匹配的义原时,为该词的每个字给出与该义原在义原库中的类型属性对应的词性分类的得分;条件随机场模型用于根据目标文本中的每个字对应每个词性分类的总得分,确定每个字的词性分类;条件随机场模型还用于确定具有相同词性分类的多个字为一个待分类词;根据待分类词的词性分类确定目标文本中的命名实体(S103)。
- 命名实体识别系统的实体类型识别-202080021811.3
- J.布里奥迪;J.伊索-西皮拉;O.奥克斯勒;T.托吉亚 - 伯耐沃伦人工智能科技有限公司
- 2020-03-23 - 2021-11-02 - G06F40/295
- 提供用于文本语料库内的实体的实体类型识别和/或消歧的方法、设备和系统,所述方法包含:接收一个或多个实体结果,每个实体结果包括表示所识别实体和所述所识别实体在所述文本语料库内的位置的数据;通过将所述文本语料库中与所述每个实体的所述位置相关联的文本输入到经过训练的实体类型(ET)模型来识别接收到的实体结果中的每个实体的实体类型,所述经过训练的ET模型配置成从所述文本语料库预测或提取所述每个实体的实体类型;以及输出表示所述接收到的实体结果中的每个实体的所识别实体类型的数据。
- 专利分类