|
钻瓜专利网为您找到相关结果 895226个,建议您 升级VIP下载更多相关专利
- [发明专利]语料生成方法、语料生成装置、和存储介质-CN201911096541.8在审
-
周辉阳
-
腾讯科技(深圳)有限公司
-
2019-11-11
-
2020-02-28
-
G06F40/295
- 本发明实施例公开了语料生成方法、语料生成装置、和存储介质,该语料生成装置涉及人工智能领域中自然语言处理,本发明可以获取预存语料数据,并将所述预存语料数据进行序列标注,得到标注实体,对所述标注实体进行筛选,以生成语料模板,其中,所述语料模板包括具有扩展样例的通用文本,对所述语料模板进行分组,得到多个子语料模板,对多个子语料模板与实体列表进行交叉组合,得到扩展语料数据,将所述预存语料数据中的知识图谱实体与所述语料模板进行组合,得到组合后语料数据,基于所述扩展语料数据和所述组合后语料数据生成目标语料数据,并输出所述目标语料数据。本发明实施例可以缩短语料数据生成时间,且使得生成的语料数据更加全面。
- 语料生成方法装置存储介质
- [发明专利]一种语料库生成和调用方法及装置-CN202011176593.9在审
-
刘玲玲
-
刘玲玲
-
2020-10-28
-
2021-01-29
-
G06F16/35
- 本申请实施例提供的一种语料库生成和调用方法及装置,属于计算机技术领域。该方法包括从待处理信息库中确定初始语料,生成初始语料向量,并确定所述初始语料向量的向量类型;根据所述向量类型和所述初始语料向量,生成第一子语料;采用预设算法对所述待处理信息库中的文本进行分类,并对得到的分类集合中的文本进行筛选,生成第二子语料;基于所述第一子语料和所述第二子语料生成目标语料库。本申请利用机器人来自动实现目标语料库的建立,以及生成可靠的目标语料库,使得降低人力成本的同时,提高目标语料库的精准,进而提升用户与机器人的交互体验。
- 一种语料库生成调用方法装置
- [发明专利]词向量生成方法和装置-CN201610095987.9有效
-
林全郴
-
腾讯科技(深圳)有限公司
-
2016-02-19
-
2020-06-23
-
G06F40/289
- 本发明涉及一种词向量生成方法和装置,所述方法包括:获取根据旧语料库生成词向量时所生成的已训练哈夫曼树;获取相对于所述旧语料库的新增语料库;将所述新增语料库中的语料进行分词处理,获得相应的新增语料词集合;将所述新增语料词集合中的词按照词频从高到低的顺序排序,获得新增语料词序列;对于所述新增语料词序列中不存在于旧语料库的新词,根据相应新词在新增语料词序列中的位置,从已训练哈夫曼树中选择哈夫曼路径;根据选择的哈夫曼路径生成所述新增语料词序列中词的词向量本发明提供的词向量生成方法和装置,提高了生成词向量的效率。
- 向量生成方法装置
|