专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果94个,建议您升级VIP下载更多相关专利
  • [发明专利]预训练语言模型获取方法、装置、电子设备和存储介质-CN201911342666.4有效
  • 庞超;王硕寰;孙宇;李芝 - 北京百度网讯科技有限公司
  • 2019-12-23 - 2023-10-20 - G06F40/295
  • 本申请公开了预训练语言模型获取方法、装置、电子设备和存储介质,涉及自然语言处理技术领域。具体实现方案为:获取第一训练语句,并确定第一训练语句的实际实体链接关系,以及将第一训练语句输入到预训练语言模型中,通过预训练语言模型中的transformer结构,得到第一训练语句中每个字符的向量表示,根据每个字符的向量表示,预测得到第一训练语句中实体的预测实体链接关系,并根据实际实体链接关系和预测实体链接关系之间的差异,调整预训练语言模型的模型参数,由此,结合训练预料中的实体确定出实体链接关系,使得训练好的预训练语言模型更好的获取实体知识信息,避免引入知识图谱导致预训练语言模型出现知识偏移现象的发生。
  • 训练语言模型获取方法装置电子设备存储介质
  • [发明专利]语言模型的训练方法、装置、介质及设备-CN202211280626.3有效
  • 丁思宇;王硕寰;赵晏彬;孙宇 - 北京百度网讯科技有限公司
  • 2022-10-19 - 2023-10-03 - G06F18/214
  • 本公开提供了一种语言模型的训练方法、装置、介质及设备,涉及人工智能技术领域,尤其涉及自然语言处理领域。实现方案为:获取样本文本和相应的样本标签;基于样本文本,获取第一分词序列和第二分词序列;将第一分词序列的多个分词输入到第一子模型中,以获得第一预测结果;将第二分词序列的多个分词输入到第二子模型中,以获得第二预测结果;基于第一预测结果和第二预测结果,计算第一损失函数;基于第一预测结果、第二预测结果和该样本数据相应的样本标签,计算第二损失函数;以及基于第一损失函数和第二损失函数,调整初始语言模型的至少一个参数,以获得语言模型。
  • 语言模型训练方法装置介质设备
  • [发明专利]大语言模型的训练方法、装置、设备和介质-CN202310814621.2在审
  • 丁思宇;王硕寰;赵晏彬;孙宇;田浩;吴华;王海峰 - 北京百度网讯科技有限公司
  • 2023-07-04 - 2023-09-29 - G06F18/214
  • 本公开提供了一种大语言模型的训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及自然语言处理和深度学习等技术领域。该方法包括:获取大规模无监督文本数据;从大规模问答数据中提取多个问题答案对;基于多个问题答案对,构建弱监督指令数据,包括:针对多个问题答案对中的每一个问题答案对,将该问题答案对中的问题作为样本指令,并将该问题答案对中的答案作为与样本指令对应的真值回复数据,构建与该问题答案对对应的指令训练样本;以及基于与多个问题答案对各自对应的指令训练样本,构建弱监督指令数据;以及利用包括大规模无监督文本数据和弱监督指令数据的混合训练数据,对大语言模型进行预训练。
  • 语言模型训练方法装置设备介质
  • [发明专利]训练文本扩充方法、装置、设备以及存储介质-CN202010498884.3有效
  • 庞超;王硕寰;孙宇;李芝 - 北京百度网讯科技有限公司
  • 2020-06-04 - 2023-09-29 - G06F18/214
  • 本申请实施例公开了训练文本扩充方法、装置、设备以及存储介质,涉及自然语言处理、深度学习、知识图谱技术领域。该方法的一具体实施方式包括:识别第一训练文本中存在的实体集合;从所存在的实体集合中选取第一实体;查找第一实体所属的概念下的实体集合;从概念下的实体集合中选取第二实体,其中,第一实体与第二实体不同;利用第二实体替换第一训练文本中的第一实体,得到第二训练文本。该实施方式通过实体替换策略,利用同一概念下的不同实体对训练文本进行实体替换,引入了结构化人工知识的强噪声,从而实现了利用外部知识对训练文本的信息补充,提升了任务所需信息的完整性。
  • 训练文本扩充方法装置设备以及存储介质
  • [发明专利]交互方法和装置-CN201811645088.7有效
  • 王硕寰;孙宇;王丽杰 - 百度在线网络技术(北京)有限公司
  • 2018-12-29 - 2023-09-19 - G06F16/35
  • 本申请实施例公开了交互方法和装置。该方法的一具体实施方式包括:基于查询语句的成分关键词,生成查询语句对应的查询逻辑语句;基于查询语句对应的查询逻辑语句,获取用于生成答案语句的信息;基于用于生成答案语句的信息,生答案语句,将答案语句反馈给用户。查询逻辑语句可以同时指示多个查询逻辑,查询逻辑语句与具体的领域无关,查询逻辑语句可以适用于用于查询多个不同的领域的查询语句对应的答案语句。每一步为了获取生成答案所需的信息进行的转换得到的表达式也可适用于用于查询多个不同的领域的查询语句对应的答案语句。从而,可对诸如包含多个查询逻辑的复杂的查询语句进行分析而生成答案语句,同时,减少了生成答案语句的开销。
  • 交互方法装置
  • [发明专利]知识表示学习方法、装置、设备以及存储介质-CN202010524534.X有效
  • 庞超;王硕寰;孙宇;李芝 - 北京百度网讯科技有限公司
  • 2020-06-10 - 2023-08-15 - G06N5/022
  • 本申请实施例公开了知识表示学习方法、装置、设备以及存储介质,涉及自然语言处理、深度学习技术领域。该方法的一具体实施方式包括:获取行业训练文本;利用掩码语言模型对行业训练文本中的行业词进行掩码,得到掩码训练文本;将掩码训练文本输入至预训练语言模型,学习得到行业训练文本中的每个字的知识表示。该实施方式利用特定行业的训练文本训练预训练语言模型,提升了预训练语言模型应用到特定行业任务上的效果。此外,在训练过程中,利用掩码语言模型对行业训练文本中的行业词进行掩码,使得预训练语言模型能够结合完整的行业词学习其中每个字的知识表示,从而提升了预训练语言模型对行业词中的每个字的知识表示的学习效果。
  • 知识表示学习方法装置设备以及存储介质
  • [发明专利]特征确定模型的训练方法、语义分析方法、装置及电子设备-CN202110746978.2有效
  • 尚骏远;王硕寰;丁思宇 - 北京百度网讯科技有限公司
  • 2021-06-30 - 2023-07-21 - G06N3/08
  • 本公开提供了一种特征确定模型的训练方法,涉及深度学习和自然语言处理的技术领域。具体方案包括:由特征确定模型包括的多级特征确定层确定预训练文本包括的多个片段中的每个片段的特征向量;以及根据特征向量执行对特征确定模型的预训练,由多级特征确定层确定预训练文本包括的每个片段的特征向量包括:由当前级特征确定层,根据由当前级特征确定层针对在前片段确定的在前片段特征向量和由在前级特征确定层针对一个片段确定的在前级特征向量,确定针对一个片段的当前级特征向量。本公开还提供了一种针对目标任务对特征确定模型进行训练的方法、一种针对目标任务的语义分析方法、装置、电子设备、计算机存储介质以及计算机程序产品。
  • 特征确定模型训练方法语义分析装置电子设备
  • [发明专利]预训练模型中注意力矩阵的更新方法、装置及电子设备-CN202211665709.4在审
  • 柴业坤;王硕寰;孙宇 - 北京百度网讯科技有限公司
  • 2022-12-23 - 2023-07-04 - G06F18/214
  • 本公开公开了一种预训练模型中注意力矩阵的更新方法、装置及电子设备,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能技术领域。包括:生成待掩码的第一注意力矩阵对应的第一掩码矩阵及第二掩码矩阵;将当前任务对应的样本数据分别输入第一掩码矩阵对应的第一模型及第二掩码矩阵对应的第二模型,以获取第一奖励值及第二奖励值;进而生成第三掩码矩阵;基于第三掩码矩阵,返回执行获取掩码后的模型的操作,直至获取第一注意力矩阵在样本数据下的目标掩码矩阵。由此,通过前向推断,可以较为快速的确定出目标掩码矩阵,涉及的数据量较少,从而节省了计算资源,同时也节省了确定目标掩码矩阵的时间,提高了效率。
  • 训练模型注意力矩阵更新方法装置电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top