[发明专利]基于强化学习的句子语义编码方法有效
申请号: | 201811088153.0 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109359191B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 许文深;潘嵘 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈伟斌 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及人工智能、自然语言处理的技术领域,更具体地,涉及基于强化学习的句子语义编码方法。基于强化学习的句子语义编码方法,其中,包括以下步骤,本发明利用强化学习实现类似人类行为的阅读方式,本发明强化学习的功能是定位下一步阅读的文字。本发明的创新性在于引入强化学习网络,学习一个类似人类阅读行为的阅读策略。本发明认为人类在精读文章时,对文本的阅读、处理不是按照无序或者固定的顺序形式,而是加入了跳读、重温等阅读行为,因此将这些行为通过强化学习网络赋予LSTM,使得LSTM能够以更类似人类阅读行为的方式编码文本,将能够使模型具有更好的文本理解能力。 | ||
搜索关键词: | 基于 强化 学习 句子 语义 编码 方法 | ||
【主权项】:
1.基于强化学习的句子语义编码方法,其特征在于,包括以下步骤:(1)State:表示当前Agent的状态,其中的状态信息主要是Agent对于当前所处环境、自身状态的认知;(2)Action:Agent的行为,即定位下一个阅读的位置或者停止阅读,基于的信息是State;(3)Reward:文本分类,没有得到最终的分类结果之前,reward为0,即停止编码得到最终的hidden state用于分类才会出现reward信号;正确分类reward为1,错误分类reward为0;(4)State Transition Matrix:状态转移,位置状态转移是确定性的,Agent下个位置就是Agent做出的选择,Vcontext在编码过程中保持不变。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811088153.0/,转载请声明来源钻瓜专利网。