[发明专利]一种情绪信息的处理方法及装置在审

专利信息
申请号: 201911415571.0 申请日: 2019-12-31
公开(公告)号: CN111191765A 公开(公告)日: 2020-05-22
发明(设计)人: 段素霞;赵安莉 申请(专利权)人: 华为技术有限公司
主分类号: G06N3/00 分类号: G06N3/00
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 聂秀娜
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请实施例公开了一种情绪信息的处理方法及装置、计算机设备及可读存储介质,有利于展示机器人的情绪消散过程,提高机器人的拟人程度。本申请实施例提供的方法包括:响应于机器人检测到第一情绪触发事件,根据第一情绪触发事件确定第一情绪信息;根据第一情绪信息生成第一控制信息,第一控制信息用于指示机器人依次执行用于表达情绪的第一行为和第二行为,其中,第一行为用于表达第一情绪信息所指示的情绪,第二行为用于表达比所述第一情绪信息所指示的情绪更为轻微的情绪。
搜索关键词: 一种 情绪 信息 处理 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911415571.0/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于用户情感反馈的机器人服务认知方法及系统-202110362898.7
  • 路飞;司文佳 - 山东大学
  • 2021-04-02 - 2023-01-31 - G06N3/00
  • 本发明公开了一种基于用户情感反馈的机器人服务认知方法及系统,所述方法包括以下步骤:获取当前场景信息,包括当前环境领域和用户领域的信息;基于预先构建的案例库,获取与当前场景信息相匹配的服务类型,所述案例库包括场景信息和服务类型的映射关系;根据所述服务类型相应的用户偏好度模型,获取具体服务,所述用户偏好度模型基于用户情感反馈建立。本发明基于案例推理的方法进行机器人服务自主认知,以用户情感状态为核心,利用用户偏好度模型,细化服务粒度,满足用户的个性化服务需求。
  • 一种预防人工智能干预外界的封闭式数据学习存储系统-202211359876.6
  • 刘思成;刘鹏 - 南京云创大数据科技股份有限公司
  • 2022-11-02 - 2023-01-17 - G06N3/00
  • 本发明涉及人工智能技术领域,公开了一种预防人工智能干预外界的封闭式数据学习存储系统,包括,爬虫,用于为门户站点搜索引擎和大型Web服务提供商采集数据;原始数据池,用于将爬虫采集的数据进行存储;初级数据池,用于对原始数据池经过清洗后的数据进行存储;成熟数据池,用于对初级数据池经过数据治理后的数据进行存储;密封空间,用于安装AI大脑的封闭式空间;物理隔离单向光闸,用于密封空间的数据防守。本发明,密封空间内的AI大脑会收集这些信息并充分的学习,AI大脑的数据只能通过外部人员的人类提问后经过AI大脑计算处理后,通过AI回答进行回复,不能自主控制外界设备,安全性提升,避免出现人工智能控制外界设备的情况。
  • 一种基于多层神经网络进行机器人行为预判的系统及方法-201910938220.1
  • 左国玉;潘婷婷;刘洪星 - 北京工业大学
  • 2019-09-30 - 2023-01-17 - G06N3/00
  • 本发明公开一种基于多层神经网络进行机器人行为预判的系统及方法,所述系统包括:感知预处理模块、SOAR逻辑规划模块、智能数据融合模块和多层神经网络决策模块;感知预处理模块用于获取各个物体的特征信息;SOAR逻辑规划模块用于根据特征信息中与抓取相关的特征确定各个物体对应的抓取概率,得到逻辑序列;智能数据融合模块用于提取特征信息中与任务目标相关的特征信息,并将提取的所述特征信息与所述逻辑序列进行融合;多层神经网络决策模块用于根据融合后的数据进行机器人行为预判。本发明能够使得智能机器人能学习并模仿人类处理信息的认知心理以具备完善的逻辑推理能力,实现多步的行为预判或操作控制。
  • 基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置-202111303694.2
  • 王轩;张加佳;漆舒汉;袁昊;刘洋;唐琳琳;夏文;廖清;李君一;杜明欣 - 哈尔滨工业大学(深圳)
  • 2021-11-05 - 2023-01-17 - G06N3/00
  • 本发明公开了一种基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置,包括下述步骤:获取非完全博弈环境,确定任务目标;构建第一神经网络和基于未来值预测的强化学习方法;构建事后经验回顾池;对第一神经网络进行训练,直至第一神经网络收敛;构建渐进式神经网络,实现网络模型的渐进式扩展;选择下一个任务作为任务目标,利用基于未来值预测的强化学习方法持续训练,直至所有的任务都训练完成。本发明通过使用非完全信息博弈场景中丰富的智能体状态变化作为监督信号,解决该环境下的奖励稀疏问题,同时引入持续学习框架渐进式神经网络对未来值预测网络结构进行动态扩展,解决了在该环境下的多任务场景中的灾难性遗忘的问题。
  • 一种砂带磨削螺杆曲面表面砂带磨损高度的预测方法-202211183513.1
  • 孙兴伟;陈斯睿;杨赫然;董祉序;刘寅;潘飞 - 沈阳工业大学
  • 2022-09-27 - 2023-01-13 - G06N3/00
  • 本发明涉及一种砂带磨削螺杆曲面表面砂带磨损高度的预测方法,步骤为:确定AO‑BP神经网络的实验数据;样本归一化;确定AO‑BP神经网络的网格结构;将AO‑BP神经网络的初始权值与阈值作为天鹰的初始群体;用Tent映射方式将天鹰群体的位置随机均匀分布,然后将种群个体赋值给AO‑BP神经网络,通过AO‑BP神经网络对砂带的磨损高度进行预测,将预测值与实际值的误差函数作为适应度函数;每个天鹰个体需要根据捕猎原则进行寻优,得到适应度函数最小的值,适应度函数最小的值为AO‑BP神经网络最佳的权值和阈值;对砂带磨损高度的进行预测。本发明方法解决现有的砂带磨损高度的预测方法精度不高,且预测速度较慢的问题。
  • 一种基于均值分层的改进粒子群算法-202211318394.6
  • 汪春峰;商鹏鹏 - 咸阳师范学院
  • 2022-10-26 - 2023-01-13 - G06N3/00
  • 本发明公开了一种基于均值分层的改进粒子群算法mHPSO。在算法中,首先依种群适应度的均值为标准将整个种群划分为不同层次的子群;然后根据不同层次子群中粒子的特征设计出独立的移动方程,以平衡算法的局部和全局搜索能力,提高算法的精度。同时,为了提高种群的多样性,算法中加入了随机优质邻居的选择机制。将mHPSO与其它改进的PSO算法进行数值比较,实验表明,本发明的基于均值分层的改进粒子群算法mHPSO的性能优于其它算法。
  • 一种基于Shapley值的改进蚁群算法的无人机冲突解脱方法-202110526494.7
  • 胡小蒙;王子楷;赵婧冰 - 中国民航大学
  • 2021-05-14 - 2023-01-13 - G06N3/00
  • 一种基于Shapley值的改进蚁群算法的无人机冲突解脱方法,将无人机的各项参数初始化之后,构建解空间,并对每一架无人机到达另一空间位置的概率进行分析,利用轮盘赌法选择下一空间位置,并同时需满足安全距离限制,在遍历各位置之后增加迭代次数及进行信息素更新,根据其重要系数进行排列,满足条件后进行路径向量的记录,比较迭代次数与最大迭代次数之间的关系后,对遍历各路径向量所对应的Shapley值进行统计,选取其中最小值对应的路径向量作为最终路径向量,由此进行无人机路径排布、冲突避让等。项目研究结果对推进无人机冲突、探测算法及其应用具有一定作用,可以为无人机监管运行系统的发展提供技术支撑与研究积累。
  • 基于自适应模因搜索解决双向环路布局问题的方法-202211272458.3
  • 孙雯;李文龙;陈超凡;王铸清;王风顺;李旭;姜禹 - 东南大学
  • 2022-10-18 - 2023-01-06 - G06N3/00
  • 本发明提供了一种基于自适应模因搜索解决双向环路布局问题的方法,包括以下步骤:(1)随机初始化种群,并采用局部搜索优化种群中的解;(2)采用三种特定的交叉算子,生成子代解决方案;提出一种自适应选择机制,在三个交叉算子中动态地选择最合适的交叉;(3)采用三阶段局部搜索方法进一步优化子代,以保证强化和多样化的平衡;(4)进行种群更新和交叉算子选择概率的更新。本发明在选择交叉算子和优化子代解决方案中采用自适应机制和更高级的搜索策略来重新研究双向环路系统中的布局方案,能够更好地解决现实世界中NP‑hard类的设施布局优化问题,布局快速,性能优异,对于双向环路布局问题及相应的问题具有重要的研究和实用价值。
  • 一种数据处理方法、装置、设备及计算机可读存储介质-202110747550.X
  • 杨恺;彭南博;陈晓霖;王虎;黄志翔;韩雨锦 - 京东科技控股股份有限公司
  • 2021-07-01 - 2023-01-03 - G06N3/00
  • 本申请公开了一种数据处理方法、装置、设备及计算机可读存储介质,通过数据对齐,与数据方确定建模用的目标样本数据与样本标签;在每一轮纵向联邦学习建模过程中,基于目标样本数据确定当前轮所用的目标数量的目标数据,基于样本标签确定各个目标数据的目标标签;获取当前轮之前的已有联邦集成树模型对目标数据的标签预测值;基于每个目标数据及对应的目标标签、标签预测值,构建对应的随机森林树模型;基于随机森林树模型确定当前轮构建的联邦集成树模型;基于每一轮构建的联邦集成树模型确定目标联邦树模型,以基于目标联邦树模型进行数据处理;其中,第一轮之前的已有联邦集成树模型的标签预测值为零。数据处理效率高。
  • 利用异构代理组进行图卷积强化学习-202180033180.1
  • 安东·科切图罗夫;德米特里·弗拉德金;尼古拉·博罗季诺夫;阿基梅德斯·马丁内斯·卡内多 - 西门子公司
  • 2021-04-30 - 2022-12-30 - G06N3/00
  • 用于自适应地控制系统的异构系统的系统和方法。图卷积网络(GCN)接收表示处于系统的时刻和状态下的观察到的环境的拓扑的图的时间序列。生成具有每个图节点的局部信息的嵌入式特征。这些嵌入式特征被划分为根据限定的分组(诸如节点类型)来分组的嵌入式状态。若干强化学习算法中的每一个强化学习算法都被分配给唯一的组,并且包括自适应控制策略,在该自适应控制策略中学习针对给定嵌入式状态的控制动作。响应于控制动作,从环境接收具有与专用于唯一的组的性能有关的局部奖励和与整个图的性能有关的全局奖励的奖励信息。使用状态信息、控制动作信息和奖励信息来更新GCN和自适应控制策略的参数。
  • 针对基于成功历史和外部存档机制的差分进化改进方法-202211224424.7
  • 李银通;韩统;唐上钦;周欢;黄长强 - 中国人民解放军空军工程大学
  • 2022-10-08 - 2022-12-27 - G06N3/00
  • 提出一种通用的针对基于成功历史和外部存档机制的差分进化改进方法,包括:初始化参数;初始化种群并进行评价;判断算法终止条件;自适应参数选择机制APSM;生成控制参数;采用RSP确定搜索个体被选择的概率;执行变基于RSP的变异策略生成变异种群;越界值处理;执行交叉操作生成试验种群;评估试验种群;采用贪婪策略更新种群P和采用先入先出FIFO方法更新外部存档A;更新历史成功参数MCR和MF;种群规模线性减少缩减,采用贪婪策略缩减种群。本发明所提出的方法可充分利用成功历史信息,加速算法的进化过程;有效避免外部存档中的元素被过度使用,提高种群的多样性,增强算法的全局搜索能力;充分利用优势种群信息,指导算法向全局最优解的方向进化。
  • 一种离散优化用于卷积神经网络通道压缩方法-202211163982.7
  • 段强;葛君正;姜凯;胡雷钧 - 山东浪潮科学研究院有限公司
  • 2022-09-23 - 2022-12-23 - G06N3/00
  • 本发明提供了一种离散优化用于卷积神经网络通道压缩方法,包括以下中步骤:初始化种群卷积层,设置种群大小;初始化种群卷积神经网络,将VGG和Resnet‑18网络由层叠的种群卷积替换原卷积结构;设置种群,将种群设置为进化种群,计算种群中每个通道的适应度和每个个体的适应度个体的适应度;设计交叉变异方法,模型训练后删除适应度排名最差的种群,使用所有通道中适应度最高的的几个卷积核组成的小组替换;设计种群更新方法,将与其他个体相似度最高的通道组删除,并且改为一个初始化通道组;进行通道压缩,根据适应度排序删除一部分个体或者通道,实现通道剪枝。本发明可以快速实现在不影响网络效果的同时进行通道压缩。
  • 基于NSGA-Ⅱ的改进多目标优化的方法-202211070337.0
  • 冯炫;金雨昊;郭强;曹豪;潘冬 - 陕西智引科技有限公司
  • 2022-08-31 - 2022-12-23 - G06N3/00
  • 本发明属于计算机应用技术领域,尤其涉及一种基于NSGA‑Ⅱ的改进多目标优化的方法。本发明通过对NSGA‑Ⅱ算法中非支配排序方法、非支配个体的拥挤距离计算赋值以及交叉、变异操作的改进,使本发明所提供的多目标优化的方法所得到的解的分布更为集中,进而解决了现有NSGA‑Ⅱ算法在多目标优化应用中所存在的技术问题,同时,本发明所提供的方法简单、操作方便、适合大规模推广使用。
  • 一种基于多模态多目标的特征选择算法-202110693647.7
  • 王艳丽;梁静;岳彩通;胡毅;崔丹丹 - 郑州大学;郑州经贸学院
  • 2021-06-22 - 2022-12-23 - G06N3/00
  • 本发明提出了一种基于多模态多目标的特征选择算法,该算法包括以下步骤:对训练数据集进行初始化种群个体,对生成的种群个体进行非支配排序;以KNN的预测精度和选择的特征个数计算适应度值和SDE指标值;根据SDE指标值计算FER值;根据FER值采用轮盘赌策略选中父代个体,通过变异和交叉操作生成新个体,将新个体再进行非支配排序和变异操作;形成新种群,并计算适应度值,将新种群与初始化种群放入档案集中,并进行非支配排序和计算相应的SDE指标值,以帕累托前沿数最下和SDE指标值最下为准则保留档案集中前N个个体。本发明搜索多个最优或次优特征子集,这些解集可用于设计选择特征数量少、分类精度高的学习器以供决策者进行选择。
  • 机器学习算法搜索-202180012813.0
  • 梁辰;大卫·理查德·索;埃斯特班·阿尔贝托·瑞尔;国·V·勒 - 谷歌有限责任公司
  • 2021-02-08 - 2022-12-16 - G06N3/00
  • 描述了一种用于搜索输出机器学习(ML)算法以执行ML任务的方法。该方法包括:接收训练示例集和验证示例集,并且生成候选ML算法的序列以执行任务。对于该序列中的每个候选ML算法,该方法包括:通过执行相应候选设置函数来设置用于候选ML算法的一个或多个训练参数,通过使用相应候选预测函数和相应候选学习函数处理训练示例集来训练候选ML算法,以及通过对验证示例集执行相应候选预测函数来评估训练后的候选ML算法的性能以确定性能度量。该方法包括选择具有最佳性能度量的训练候选ML算法作为用于任务的输出ML算法。
  • 一种基于人工智能的合成说话表情的方法和相关装置-201910745062.8
  • 李广之;陀得意;康世胤 - 腾讯科技(深圳)有限公司
  • 2018-11-14 - 2022-12-16 - G06N3/00
  • 本申请实施例公开了一种基于人工智能的合成说话表情的方法和相关装置,至少涉及人工智能中的多种技术,针对终端发送的文本内容,确定文本内容对应的文本特征和所述文本特征所标识发音元素的时长,通过表情模型,获得所述文本特征、所标识发音元素的时长对应的目标表情特征;并向所述终端返回所述目标表情特征。该表情模型可以对该文本特征中具有不同时长的同一发音元素确定出不同的子表情特征,增加了说话表情的变化样式,根据表情模型所确定目标表情特征生成的说话表情与说话人的表情搭配,由于对于同一个发音元素说话表情具有不同的变化样式,从而改善了说话表情变化的过度不自然的情况,提高了用户的沉浸感。
  • 一种基于蚁群算法的机器人清理优化方法-202211136536.7
  • 徐升;侯睿明;朱兵;徐蓉蓉;吴新宇 - 中国科学院深圳先进技术研究院
  • 2022-09-19 - 2022-12-13 - G06N3/00
  • 本发明公开了一种基于蚁群算法的机器人清理优化方法。该方法包括:针对目标区域的待摆放工件,确定各工件的位置信息,所述位置信息包括在机械臂坐标系下的坐标点和旋转角度;以设定的损失函数为优化目标,利用蚁群算法获得工件清理的最佳执行顺序,其中将待摆放工件作为蚂蚁走过的位置点,将工件摆放工序作为蚂蚁的行走路径;驱动机械臂基于所获得的最佳执行顺序以及所述位置信息进行工件清理。本发明结合蚁群算法的优化能力,显著提升了机器人清理桌面的效率和智能性。
  • 一种自适应海豚觅食算法的裂纹检测图像分割方法-202211109673.1
  • 向卫 - 南京视测通机器人科技有限公司
  • 2022-09-13 - 2022-12-09 - G06N3/00
  • 本发明公开了一种自适应海豚觅食算法的裂纹检测图像分割方法,属于裂纹检测图像分割技术领域,具体包括以下步骤:海豚觅食算法设计,DFA算法满足如下理想规则;每只海豚都根据超声波的回声定位进行距离的探测,以此来判断猎物及障碍物的方位;每只海豚以速度vn,从位置xn为起点出发,随机搜索猎物;无论海豚发出的超声波的响度将如何变化,都将由原初始值减小到一固定最小值。本发明对于提出的图像分割方法进行论述及验证,解决了裂纹图像的分割未能分出所有的目标,以及细节特征消失的问题,为后续的钢箱梁裂纹图像分割的研究提供参考意义。
  • 一种无陀螺条件下基于改进麻雀搜索算法的高旋体角速率在线估计方法-202211052055.8
  • 邓志红;汪进文;苗志豪;沈凯 - 北京理工大学
  • 2022-08-31 - 2022-12-09 - G06N3/00
  • 本发明的一种无陀螺条件下基于改进麻雀搜索算法的高旋体角速率在线估计方法,根据磁阻传感器的工作原理及输出特性,探究其与高旋体角速率的间接和直接关系,设计以角速率为优化对象的多目标适应度函数,从而完成角速率在线估计模型的构建;根据SSA自身的优缺点,为了麻雀搜索具有方向性以及快速性,提出自适应动态步长策略和动态压缩搜索策略改进传统的SSA,从而提高算法的寻优能力和跳出局部极值的能力,采用ISSA对角速率在线估计模型进行优化求解,从而实现无陀螺条件下高旋体角速率的在线估计。
  • 基于PSO-LM-BP神经网络的带钢冷轧横向厚差预报方法-201910316881.0
  • 王东城;徐扬欢;黄阳阳;张桐源;杨光;刘宏民 - 燕山大学
  • 2019-04-19 - 2022-12-09 - G06N3/00
  • 本发明公开了一种基于PSO‑LM‑BP神经网络的带钢冷轧横向厚差预报方法,涉及到带钢断面形状控制领域。该方法主要包括以下步骤:1、PSO‑LM‑BP神经网络训练样本的获取;2、PSO‑LM‑BP神经网络带钢冷轧横向厚差预报模型的建立;3、PSO‑LM‑BP神经网络带钢冷轧横向厚差预报模型的训练与验证;4、PSO‑LM‑BP神经网络带钢冷轧横向厚差预报模型的预测。该方法只需根据带钢热轧来料断面轮廓三个参数C40、C25、W40,即可预测出其冷轧后的横向厚差值,预测精度高、响应速度快,能够快速参与指导实际生产,对带钢冷轧横向厚差控制具有重要意义。
  • 一种基于蝙蝠算法的无线传感网络定位方法-202211202639.9
  • 孟维;陈大龙;黄道宏;王计斌 - 南京华苏科技有限公司
  • 2022-09-28 - 2022-12-06 - G06N3/00
  • 本发明公开了一种基于蝙蝠算法的无线传感网络定位方法,包括以下步骤:S1:初始化各个参数以及解空间中的蝙蝠个体的位置及飞行速度,并获得种群中每个个体的适应度值并记录全局最优个体;S2:动态产生变异群集,计算变异群体参数值,再根据贪婪规则选择出最好个体替换原始个体;S3:计算适应度值并标记全局最优解,根据全局最优解更新个体的位置和飞行速度,并计算更新后的适应度值;S4:利用随机数判断是否产生新解;S5:寻找全局最优解,对最优解小范围自我学习优化;S6:重复步骤S2~S5,直至满足设定的最优解条件或搜索达到最大迭代次数,从而获得位置信息。该方法有效提高了定位精度,降低了测距误差对定位精度影响。
  • 基于进化神经网络的移动目标识别方法、装置和设备-202211082225.7
  • 王楠;邢堃盛;王伟;洪华杰;何科延;黄杰;王建华;庙要要 - 中国人民解放军国防科技大学
  • 2022-09-06 - 2022-12-06 - G06N3/00
  • 本申请涉及基于进化神经网络的移动目标识别方法、装置和设备,该方法包括:通过无人值守传感器系统采集车辆与行人移动时的传感信号并做信号预处理;传感信号包括声音信号与地面震动信号;根据声音信号与地面震动信号,构建训练集和测试集;训练集与测试集中的信号数据不相同;采用进化神经网络在训练集中进行训练,得到最优特征提取方法和神经网络模型;根据最优特征提取方法和神经网络模型,对测试集中的环境噪音、行人和移动车辆进行识别与分类,得到识别的移动目标;移动目标包括行人和移动车辆。能够用最小的特征向量与最低的网络复杂度实现较高的识别准确率。
  • 一种支持图灵测试模式的人机对抗系统及智能体测试方法-202111328333.3
  • 倪晚成;徐佳乐;王士贤;黄凯奇;杨旭阳 - 中国科学院自动化研究所
  • 2021-11-10 - 2022-12-06 - G06N3/00
  • 本发明提供一种支持图灵测试模式的人机对抗系统及智能体测试方法,所述系统包括:人机对抗模块,用于完成人机对抗;其中,通过人类对抗者和智能体在双盲环境下完成人机对抗;对抗数据采集模块,用于获取人机对抗结果以及人机对抗的复盘对抗数据;对抗数据分析模块,用于根据复盘对抗数据获取智能体的效能数据;图灵问卷模块,用于通过图灵问卷的形式,采集智能体的外界评价信息;对抗成绩管理模块,用于接收并存储人机对抗结果、智能体的外界评价信息和智能体的效能数据,并根据人机对抗结果、智能体的外界评价信息和智能体的效能数据获取智能体的能力测试结果。本发明实现了对智能体决策能力的全面有效地测试。
  • 用于训练模型的基于有向无环图的框架-202211065466.0
  • G·辛格拉朱;C·潘 - 甲骨文国际公司
  • 2020-04-23 - 2022-12-02 - G06N3/00
  • 本公开涉及一种用于训练模型的基于有向无环图DAG的框架。本公开涉及用于聊天机器人的技术,并且更具体地,用于使用基于DAG的框架来构建并训练模型的技术。在一个特定方面,提供了一种计算机实施的方法,该方法包括通过基于DAG的框架生成第一模型和第二模型、在运行时间内执行用于聊天机器人的第一模型并且在设计时间内执行用于聊天机器人的第二模型、在聊天机器人运行第一模型和第二模型时收集用于与一组话语相关联的意图分类的属性、使用一个或多个度量基于对用于意图分类的属性的分析来评估第一模型和第二模型的性能、确定第二模型与第一模型相比性能是否有所提高、以及基于性能确定在运行时间内执行用于聊天机器人的第一模型或第二模型。
  • 通过具有不确定性估计的强化学习的战术决策制定-202080099710.8
  • 卡尔-约翰·赫尔;里奥·莱恩 - 沃尔沃自主解决方案公司
  • 2020-04-20 - 2022-12-02 - G06N3/00
  • 一种使用强化学习RL代理控制自主车辆的方法(100),该方法包括:多个训练会话(110‑1,…,110‑K),其中,RL代理与包括自主车辆的环境交互,每个训练会话具有不同的初始值,并生成取决于状态和动作的状态‑动作值函数Qk(s,a);决策制定(112),其中,RL代理输出与自主车辆的控制相关的至少一个暂定决策;基于多个状态‑动作值函数的可变性度量的不确定性估计(114),该多个状态‑动作值函数针对与暂定决策中的每个相对应的状态‑动作对来评估;以及车辆控制(116),其中,依赖于所估计的不确定性来执行至少一个暂定决策。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top