[发明专利]一种基于可随机访问的点互信息的词表示学习方法在审
| 申请号: | 202211623207.5 | 申请日: | 2022-12-16 |
| 公开(公告)号: | CN115952807A | 公开(公告)日: | 2023-04-11 |
| 发明(设计)人: | 陈怡疆;林海;苏畅 | 申请(专利权)人: | 厦门大学 |
| 主分类号: | G06F40/44 | 分类号: | G06F40/44;G06F40/284;G06F40/30;G06F40/49 |
| 代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
| 地址: | 361005 *** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种基于可随机访问的点互信息的词表示学习方法,涉及自然语言处理。A.准备大规模无标注文本语料库;B.扫描所述语料库并统计词对得到词共现矩阵;C.用基于GloVe模型的大规模矩阵随机访问方法实现对词共现矩阵的随机访问,得到该矩阵的元素的近似值;D.用随机访问得到的词共现矩阵的元素的近似值计算点互信息;E.基于点互信息计算注意力权重,将注意力权重应用于Skip‑gram或GloVe模型词表示学习得到目标词表示。提出点互信息注意力权重算子,提出适合Skip‑gram和GloVe模型的注意力机制,针对计算点互信息时使用的共现矩阵过大无法完整载入内存,提出随机访问方法。获得更高质量的词表示。 | ||
| 搜索关键词: | 一种 基于 随机 访问 互信 词表 学习方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211623207.5/,转载请声明来源钻瓜专利网。





