[发明专利]基于模糊强化学习的销售语音推送决策方法在审

申请号：	202211353575.2	申请日：	2022-11-01
公开（公告）号：	CN115563339A	公开（公告）日：	2023-01-03
发明（设计）人：	杨艺;贺广涛	申请（专利权）人：	无锡来龙去脉科技有限公司
主分类号：	G06F16/632	分类号：	G06F16/632;G06F16/683;G06N20/00;G06Q30/01;G10L25/63
代理公司：	郑州异开专利事务所(普通合伙) 41114	代理人：	韩鹏程
地址：	214028 江苏省无锡市新吴区菱***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于模糊强化学习销售语音推送决策方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于模糊强化学习的销售语音推送决策方法，其特征在于：包括以下步骤：

S1，根据语句情感量化库，确定当前语音内容的情感量化值y；

S2，采用三角隶属度函数确定所述情感量化值在语句模糊变量值阈上的隶属度；

S3，所述隶属度组成当前语音内容的状态空间S；

S4，将所有推送语音信息组成当前语音内容的动作空间A；

S5，计算当前时刻t所述状态空间S中任一状态值s_i执行所述动作空间A中任一动作变量a_i时的回报值；

S6，根据Q-learning算法，迭代学习得到所述状态空间S中任一状态值s_i执行所述动作空间A中任一动作变量a_i时的Q值；

S7，选取最大Q值对应的动作变量a_i为当前语音内容的推送语音信息。

2.根据权利要求1所述的基于模糊强化学习的销售语音推送决策方法，其特征在于：所述语句情感量化库根据历史经验，抽取语句关键词，并语句及关键词评分。

3.根据权利要求1所述的基于模糊强化学习的销售语音推送决策方法，其特征在于：所述语句模糊变量值阈,其中分别代表很不高兴、不高兴、一般、高兴、很高兴；的取值范围为。

4.根据权利要求1所述的基于模糊强化学习的销售语音推送决策方法，其特征在于：所述动作空间A中所述所有推送语音信息的编码按照情感等级从低到高排列。

5.根据权利要求3所述的基于模糊强化学习的销售语音推送决策方法，其特征在于：所述回报值计算公式为：

，

其中为权重因子，表示所述语句模糊变量阈值中和变化的权重。

6.根据权利要求1所述的基于模糊强化学习的销售语音推送决策方法，其特征在于：所述Q值迭代规则为：，其中和为学习率，R为当前所述状态空间S中任一状态值s_i执行所述动作空间A中任一动作变量a_i后的回报值；为当前所述状态空间S中状态值s_i执行所述动作空间A中动作变量a_i后进入下一个状态值s_i’执行所述动作空间A中动作变量a_i的值；max代表取状态值s_i’执行所述动作空间A中所有动作变量a_i的值的最大值。

7.根据权利要求1所述的基于模糊强化学习的销售语音推送决策方法，其特征在于：所述状态值s_i为所述隶属度除以0.1取整后再乘以0.1。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于无锡来龙去脉科技有限公司，未经无锡来龙去脉科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211353575.2/1.html，转载请声明来源钻瓜专利网。

上一篇：突破精益瓶颈管理的多台AGV自主协同作业方法和系统
下一篇：一种桥梁变形检测设备及使用方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于模糊强化学习的销售语音推送决策方法在审

专利文献下载