[发明专利]词嵌入方法和设备以及词搜索方法在审
| 申请号: | 202010310047.3 | 申请日: | 2020-04-20 |
| 公开(公告)号: | CN112733536A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 柳尚贤;金映锡;崔俊辉 | 申请(专利权)人: | 三星电子株式会社 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/30;G06F40/242;G06N3/04;G06N3/08 |
| 代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王兆赓;黄晓燕 |
| 地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 嵌入 方法 设备 以及 搜索 | ||
1.一种词嵌入方法,包括:
基于化学物质的特性信息来训练词嵌入模型;和
从词嵌入模型获取表示化学物质的词的嵌入向量,
其中,词嵌入模型被配置为预测输入词的上下文词。
2.根据权利要求1所述的词嵌入方法,其中,训练词嵌入模型的步骤包括:基于化学物质的结构信息、成分信息以及物理性质信息中的任何一个或任何组合来训练词嵌入模型。
3.根据权利要求1所述的词嵌入方法,其中,训练词嵌入模型的步骤包括:训练词嵌入模型,使得响应于化学物质的结构信息被输入到词嵌入模型,表示化学物质的词的上下文词从词嵌入模型被输出。
4.根据权利要求3所述的词嵌入方法,其中,基于指纹、简化分子线性输入规范、图形和图像中的一个的格式来确定化学物质的结构信息。
5.根据权利要求1所述的词嵌入方法,其中,训练词嵌入模型的步骤包括:训练词嵌入模型,使得响应于化学物质的成分信息被输入到词嵌入模型,表示化学物质的词的上下文词从词嵌入模型被输出。
6.根据权利要求5所述的词嵌入方法,其中,化学物质的成分信息从表示化学物质的词获取。
7.根据权利要求5所述的词嵌入方法,其中,将表示化学物质的词分成字母或元素,并且将字母或元素顺序地输入到词嵌入模型。
8.根据权利要求1所述的词嵌入方法,其中,训练词嵌入模型的步骤包括:训练词嵌入模型,使得化学物质的物理性质信息从词嵌入模型被输出。
9.根据权利要求8所述的词嵌入方法,其中,物理性质信息包括关于化学物质的质量、体积、颜色、熔点以及沸点中的任何一个或任何组合的信息。
10.根据权利要求1所述的词嵌入方法,还包括:
将嵌入向量输入到与词嵌入模型对应的词嵌入矩阵中的与表示化学物质的词对应的部分。
11.根据权利要求1所述的词嵌入方法,还包括:
确定具有将要生成的嵌入向量的词是否表示化学物质。
12.一种存储指令的非暂时性计算机可读存储介质,所述指令在被处理器执行时,使得所述处理器执行权利要求1至权利要求11中的任意一项所述的词嵌入方法。
13.一种词搜索方法,包括:
接收将被搜索的化学物质的特性信息或表示所述化学物质的词;和
基于词嵌入矩阵输出表示具有与所述化学物质的特性相似的特性的物质的词,其中
词嵌入矩阵从基于多个化学物质的特性信息训练的词嵌入模型获取,并且
词嵌入模型被配置为预测输入词的上下文词。
14.根据权利要求13所述的词搜索方法,其中,所述化学物质的特性信息包括所述化学物质的结构信息、成分信息以及物理性质信息中的任何一个或任何组合。
15.一种词嵌入设备,包括:
处理器,被配置为:
基于化学物质的特性信息来训练词嵌入模型;和
从词嵌入模型获取表示化学物质的词的嵌入向量,和
词嵌入模型,被配置为预测输入词的上下文词。
16.根据权利要求15所述的词嵌入设备,其中,处理器还被配置为:基于化学物质的结构信息、成分信息以及物理性质信息中的任何一个或任何组合来训练词嵌入模型。
17.根据权利要求15所述的词嵌入设备,其中,处理器还被配置为:训练词嵌入模型,使得响应于化学物质的结构信息被输入到词嵌入模型,表示化学物质的词的上下文词从词嵌入模型被输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010310047.3/1.html,转载请声明来源钻瓜专利网。





