[发明专利]文本创作的词汇推荐方法、装置及服务器有效
申请号: | 202110266139.0 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112883729B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 张林箭;张荣升;张聪;江琳;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/237;G06F16/9535 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 创作 词汇 推荐 方法 装置 服务器 | ||
本发明提供了一种文本创作的词汇推荐方法、装置及服务器,涉及智能创作技术领域,包括:获取待修改的目标文本和目标文本中的待修改词汇;通过预先训练得到的词汇推荐模型对目标文本和/或待修改词汇进行词汇推荐处理,得到待修改词汇对应的多个候选推荐词汇;其中,词汇推荐模型包括基于目标文本的综合推荐子模型、基于待修改词汇的常用搭配推荐子模型、基于目标文本和待修改词汇的意象推荐子模型中的一种或多种;从多个候选推荐词汇中确定待修改词汇对应的目标推荐词汇。本发明可以推荐更适合当前文本所描述场景、更富有想象意味的词汇,从而显著提高了推荐的词汇的质量,较好地满足了用户需求。
技术领域
本发明涉及智能创作技术领域,尤其是涉及一种文本创作的词汇推荐方法、装置及服务器。
背景技术
随着人工智能(AI,Artificial Intelligence)技术的发展,AI写作/创作技术也应运而生,这类技术通常用于辅助用户创作文本,然而这类技术得到的文本中可能存在某些短语用词甚至是整句、整段均需要进行润色修改的情况。相关技术中涉及两种短语推荐方法:一种是基于同义词表进行短语推荐,但是该方法非常依赖人工准备的同义词表,不仅需要耗费较多人力对同义词表进行配置,而且由于同义词表基本固定,因此无法给用户提供惊喜感;另一种是基于词向量进行短语推荐,由于词向量是统计意义上的结果,因此该方法更倾向于推荐常见的短语,而且由于词向量词表过于庞大,因此可存在推荐无关短语的情况。综上所述,现有技术中公开的短语推荐方法不仅无法较好的推荐出适合当前文本所描述的场景的短语,而且无法为用户提供更富有想象意味的短语,从而无法较好地满足用户需求。
发明内容
有鉴于此,本发明的目的在于提供一种文本创作的词汇推荐方法、装置及服务器,可以推荐更适合当前文本所描述场景、更富有想象意味的词汇,从而显著提高了推荐的词汇的质量,较好地满足了用户需求。
第一方面,本发明实施例提供了一种文本创作的词汇推荐方法,包括:获取待修改的目标文本和所述目标文本中的待修改词汇;通过预先训练得到的词汇推荐模型对所述目标文本和/或所述待修改词汇进行词汇推荐处理,得到所述待修改词汇对应的多个候选推荐词汇;其中,所述词汇推荐模型包括基于所述目标文本的综合推荐子模型、基于所述待修改词汇的常用搭配推荐子模型、基于所述目标文本和所述待修改词汇的意象推荐子模型中的一种或多种;从所述多个所述候选推荐词汇中确定所述待修改词汇对应的目标推荐词汇。
在一种实施方式中,所述通过预先训练得到的词汇推荐模型对所述目标文本和/或所述待修改词汇进行词汇推荐处理,得到所述待修改词汇对应的多个候选推荐词汇的步骤,包括:如果所述词汇推荐模型包括所述综合推荐子模型,将所述目标文本中的所述待修改词汇替换为第一占位符,通过所述综合推荐子模型对替换后的目标文本,得到多个综合推荐词汇;如果所述词汇推荐模型包括所述意象推荐子模型,将所述目标文本中的所述待修改词汇替换为第二占位符,通过所述意象推荐子模型对替换后的目标文本进行词汇推荐处理,得到多个意象推荐词汇;如果所述词汇推荐模型包括所述常用搭配推荐子模型,通过所述常用搭配推荐子模型对所述待修改词汇进行词汇推荐处理,得到多个常用搭配推荐词汇;其中,所述候选推荐词汇包括所述综合推荐词汇、所述意象推荐词汇、所述常用搭配推荐词汇中的一种或多种。
在一种实施方式中,所述综合推荐子模型的训练步骤,包括:获取第一训练数据;其中,所述第一训练数据包括第一训练文本和训练词汇,所述第一训练文本中采用第三占位符替代所述训练词汇;将所述第一训练文本作为所述综合推荐子模型的输入,以及将所述训练词汇作为所述综合推荐子模型的输出,对所述综合推荐子模型进行训练;其中,所述综合推荐子模型包括seq2seq模型。
在一种实施方式中,所述意象推荐子模型的训练步骤,包括:获取多个已有文本,并根据各个所述已有文本中的词汇词频确定意象词汇;基于所述意象词汇构建第二训练数据;其中,所述第二训练数据包括所述第二训练文本和所述意象词汇,所述第二训练文本中采用第四占位符代替所述意象词汇;将所述第二训练文本作为所述意象推荐子模型的输入,以及将所述意象词汇作为所述意象推荐子模型的输出,对所述意象推荐子模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266139.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服装智能制板系统及方法
- 下一篇:一种电机结构及永磁深井泵