[发明专利]采用深度学习的名称实体识别在审

专利信息
申请号: 202080024080.8 申请日: 2020-03-23
公开(公告)号: CN113853606A 公开(公告)日: 2021-12-28
发明(设计)人: J.伊索-西皮拉;F.A.克鲁格;A.萨法里;T.托吉亚 申请(专利权)人: 伯耐沃伦人工智能科技有限公司
主分类号: G06F40/295 分类号: G06F40/295
代理公司: 北京市柳沈律师事务所 11105 代理人: 邸万奎
地址: 英国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 提供了用于识别文本语料库中的实体的系统、方法和装置。该系统包括:第一命名实体识别(NER)系统,其包含一个或多个实体词典,所述第一NER系统被配置为基于一个或多个实体词典识别文本语料库中的实体和/或实体类型;第二NER系统,其包含被配置用于预测所述文本语料库内的实体和/或实体类型的NER模型;以及比较模块,其被配置为基于比较从第一和第二NER系统输出的实体结果来识别实体,其中被识别的实体与由第一NER系统识别的实体不同。该系统还可以包括更新模块,该更新模块被配置为基于被识别的实体更新一个或多个实体词典。该系统还可以包括词典构建模块,该模块被配置为至少基于被识别的实体构建一组实体词典。该系统还可以包括训练模块,其被配置为通过训练机器学习ML技术来生成或更新NER模型以使用基于代表所识别实体和/或实体类型的数据的训练数据集从文本语料库预测实体和/或实体类型。
搜索关键词: 采用 深度 学习 名称 实体 识别
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伯耐沃伦人工智能科技有限公司,未经伯耐沃伦人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202080024080.8/,转载请声明来源钻瓜专利网。

同类专利
  • 用于聊天机器人会话的实体解析-202180070225.2
  • 杨欣怡;谢天;熊蔡明;刘文昊;王欢;瞿金;S·兰卡;海楚红;叶旭刚;吴飞鸿 - 硕动力公司
  • 2021-01-16 - 2023-09-15 - G06F40/295
  • 系统使用被定制用于执行任务集合的聊天机器人来执行与用户的会话。系统可以是允许针对每个租户定制聊天机器人的多租户系统。该系统接收将任务映射到实体类型的任务配置以及指定用于确定特定实体类型的实体的方法的实体配置。系统接收用户话语并且使用意图检测模型,例如神经网络,来确定用户的意图。意图表示用户正在请求的任务。系统确定与任务相对应的一个或更多个实体。系统基于所确定的意图和实体来执行任务,并基于任务来执行与用户的会话。
  • 通过终身学习的电子商务中可扩展标签学习的系统和方法-202180076286.X
  • 单华松;周辉 - 北京沃东天骏信息技术有限公司;京东美国科技公司
  • 2021-10-27 - 2023-07-14 - G06F40/295
  • 终身标签学习的系统和方法。系统包括计算设备,其具有处理器和存储计算机可执行代码的存储设备。计算机可执行码用于:提供产品描述和表征产品的种子标签;使用产品描述和种子标签训练命名实体识别(NER)模型;使用NER模型从产品描述中预测伪标签;计算伪标签的置信度得分;将置信度得分与阈值比较,当伪标签的置信度得分大于阈值时,将伪标签定义为真标签;将真标签添加到种子标签以获得更新的标签;使用产品描述和更新的标签重复训练、预测、计算、比较和添加的步骤,以保持对更新的标签的更新。
  • 用于自动语音识别(ASR)的上下文拼写校正(CSC)-202180052809.7
  • 王晓强;刘砚清;赵晟;李锦宇 - 微软技术许可有限责任公司
  • 2021-06-15 - 2023-05-02 - G06F40/295
  • 用于语音识别的新颖解决方案提供了用于自动语音识别(ASR)的上下文拼写校正(CSC)。所公开的示例包括:接收音频流;对该音频流执行ASR处理以产生ASR假设;接收上下文列表;以及至少基于该ASR假设和该上下文列表来执行拼写校正以产生输出文本序列。在ASR模型之上使用上下文拼写校正(CSC)模型,这排除了改变原始ASR模型的需要。这准许基于上下文数据的运行时用户定制,即使对于大型上下文列表也是如此。一些示例包括过滤针对音频流的ASR假设,并且至少基于ASR假设过滤来确定是否要触发针对该ASR假设的拼写校正。一些示例包括使用具有上下文短语的经预处理转录来生成文本到语音(TTS)音频,以训练CSC模型。
  • 信息处理装置、信息处理方法以及程序-202080082266.9
  • 市村由美;石井健弘 - 株式会社东芝;东芝数字解决方案株式会社
  • 2020-11-26 - 2022-07-12 - G06F40/295
  • 即使在不存在与预先定义的项目名一致的表达的情况下,也能够确定对项目值进行设定的插槽。实施方式的信息处理装置具备:分割部,其将第一关键词分割为第一单词,并将语句分割为第二单词;提取部,其从所述语句中提取在开头包含与所述第一关键词的开头的所述第一单词一致的所述第二单词的单词列以及在末尾包含与所述第一关键词的末尾的所述第一单词一致的所述第二单词的单词列中的至少一方;以及检测部,其基于表示所述单词列与所述第一关键词的文字的相似性的文字相似度以及表示所述单词列的构成与所述第一关键词的构成的相似性的构成相似度中的至少一方,检测第二关键词。
  • 自然语言处理系统、自然语言处理方法以及自然语言处理程序-201980097045.6
  • 田方笃志 - 株式会社机器人之心
  • 2019-11-08 - 2022-01-28 - G06F40/295
  • 自然语言处理系统具有:场景设定部(10),其解析输入的自然语言的语句,生成表示理解自然语言的主体的主体数据、以及表示主体行动的世界的一部分的场景数据,在场景数据中设定主体数据;状况变化设定部(11),其解析输入的自然语言的语句,并设定场景的状况变化;正负情绪设定部(12),其基于场景的状况变化,判定是否产生了对于主体而言有利的情绪即正情绪、或者对于主体而言不利的情绪即负情绪;以及含义解析部(13),其基于产生的正负情绪进行含义解析。状况变化设定部(11)将在状况变化的前状态下作用于主体数据的价值和在状况变化的后状态下作用于主体数据的价值分别作为数值来获取。正负情绪设定部(12)计算前状态的数值与后状态的数值的差而计算出正负情绪。
  • 采用深度学习的名称实体识别-202080024080.8
  • J.伊索-西皮拉;F.A.克鲁格;A.萨法里;T.托吉亚 - 伯耐沃伦人工智能科技有限公司
  • 2020-03-23 - 2021-12-28 - G06F40/295
  • 提供了用于识别文本语料库中的实体的系统、方法和装置。该系统包括:第一命名实体识别(NER)系统,其包含一个或多个实体词典,所述第一NER系统被配置为基于一个或多个实体词典识别文本语料库中的实体和/或实体类型;第二NER系统,其包含被配置用于预测所述文本语料库内的实体和/或实体类型的NER模型;以及比较模块,其被配置为基于比较从第一和第二NER系统输出的实体结果来识别实体,其中被识别的实体与由第一NER系统识别的实体不同。该系统还可以包括更新模块,该更新模块被配置为基于被识别的实体更新一个或多个实体词典。该系统还可以包括词典构建模块,该模块被配置为至少基于被识别的实体构建一组实体词典。该系统还可以包括训练模块,其被配置为通过训练机器学习ML技术来生成或更新NER模型以使用基于代表所识别实体和/或实体类型的数据的训练数据集从文本语料库预测实体和/或实体类型。
  • 实体识别的方法和装置、建立词典的方法、设备、介质-202080000047.1
  • 代亚菲 - 京东方科技集团股份有限公司
  • 2020-01-20 - 2021-11-09 - G06F40/295
  • 一种命名实体识别的方法包括:获取目标文本(S101);根据预设的条件随机场模型确定目标文本中的待分类词及其词性分类(S102);条件随机场模型包括义原函数和模板函数;每个模板函数用于给出目标文本中的每个字对应每个词性分类的得分;义原函数用于将目标文本中的至少部分词与预设的义原库中的义原匹配,并在词具有匹配的义原时,为该词的每个字给出与该义原在义原库中的类型属性对应的词性分类的得分;条件随机场模型用于根据目标文本中的每个字对应每个词性分类的总得分,确定每个字的词性分类;条件随机场模型还用于确定具有相同词性分类的多个字为一个待分类词;根据待分类词的词性分类确定目标文本中的命名实体(S103)。
  • 命名实体识别系统的实体类型识别-202080021811.3
  • J.布里奥迪;J.伊索-西皮拉;O.奥克斯勒;T.托吉亚 - 伯耐沃伦人工智能科技有限公司
  • 2020-03-23 - 2021-11-02 - G06F40/295
  • 提供用于文本语料库内的实体的实体类型识别和/或消歧的方法、设备和系统,所述方法包含:接收一个或多个实体结果,每个实体结果包括表示所识别实体和所述所识别实体在所述文本语料库内的位置的数据;通过将所述文本语料库中与所述每个实体的所述位置相关联的文本输入到经过训练的实体类型(ET)模型来识别接收到的实体结果中的每个实体的实体类型,所述经过训练的ET模型配置成从所述文本语料库预测或提取所述每个实体的实体类型;以及输出表示所述接收到的实体结果中的每个实体的所识别实体类型的数据。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top