[发明专利]文本转矢量图的方法及装置有效
申请号: | 201711472913.3 | 申请日: | 2017-12-28 |
公开(公告)号: | CN109977368B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 胡庆;何茂强 | 申请(专利权)人: | 海能达通信股份有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/106;G06F40/284;G06F16/56 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 袁江龙 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 矢量图 方法 装置 | ||
1.一种文本转矢量图的方法,其特征在于,所述方法包括:
将待转换文本分解为词序列;
利用已建立的词向量表将分解后的词序列中的每个词变成词向量,获得词向量序列;
将所述词向量序列输入已训练好的神经网络模型中,获得由多个矢量图向量组成的矢量图向量序列,所述神经网络模型是以多个已知的词向量序列作为输入、以对应的多个已知的矢量图向量作为输出进行训练而得到的;
将所述矢量图向量序列按照预定要求转换为矢量图;
其中,所述矢量图为流程图,所述流程图由多个具有上下连接关系和/或左右连接关系的图元组成,所述矢量图向量包括图元序号、父图元序号、图元唯一标识、参数1、参数2、……、参数n;
所述将所述矢量图向量序列按照预定要求转换为矢量图,包括:
根据所述矢量图向量中的图元序号,确定所述图元位于上下位置关系中的哪一层图元,根据所述矢量图向量中的父图元序号,确定与所述图元直接连接的上一层的图元,根据所述矢量图向量中的图元唯一标识确定所述图元位于左右位置关系中的哪一个图元,根据所述参数1、参数2、……、参数n,确定所述图元的具体内容。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采取监督学习模式,以多个已知的、打标签的词向量序列作为输入、以对应的多个已知的矢量图向量作为输出进行训练,而获得所述神经网络模型。
3.根据权利要求1所述的方法,其特征在于,所述将所述待转换文本分解为词序列,包括:
通过分词器将待转换文本分解为词序列。
4.一种文本转矢量图的装置,其特征在于,所述装置包括:处理器、存储器以及输入输出装置,所述处理器分别与所述存储器、所述输入输出装置耦合,其中,
所述存储器用于存储程序;
所述输入输出装置用于输入待转换文本和输出矢量图;
所述处理器当运行所述程序时用于通过所述输入输出装置获取所述待转换文本,将所述待转换文本分解为词序列;利用已建立的词向量表将分解后的词序列中的每个词变成词向量,获得词向量序列;将所述词向量序列输入已训练好的神经网络模型中,获得由多个矢量图向量组成的矢量图向量序列,所述神经网络模型是以多个已知的词向量序列作为输入、以对应的多个已知的矢量图向量作为输出进行训练而得到的;将所述矢量图向量序列按照预定要求转换为矢量图;
其中,所述矢量图为流程图,所述流程图由多个具有上下连接关系和/或左右连接关系的图元组成,所述矢量图向量包括图元序号、父图元序号、图元唯一标识、参数1、参数2、……、参数n;
所述处理器当运行所述程序时还用于根据所述矢量图向量中的图元序号,确定所述图元位于上下位置关系中的哪一层图元,根据所述矢量图向量中的父图元序号,确定与所述图元直接连接的上一层的图元,根据所述矢量图向量中的图元唯一标识确定所述图元位于左右位置关系中的哪一个图元,根据所述参数1、参数2、……、参数n,确定所述图元的具体内容。
5.根据权利要求4所述的装置,其特征在于,所述处理器当运行所述程序时还用于采取监督学习模式,以多个已知的、打标签的词向量序列作为输入、以对应的多个已知的矢量图向量作为输出进行训练,而获得所述神经网络模型。
6.根据权利要求4所述的装置,其特征在于,所述处理器当运行所述程序时还用于通过分词器将待转换文本分解为词序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海能达通信股份有限公司,未经海能达通信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711472913.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能编纂方法
- 下一篇:一种商品管理系统及方法