[发明专利]用于辅助文本生成的方法和设备与存储介质在审
申请号: | 202110346620.0 | 申请日: | 2021-03-31 |
公开(公告)号: | CN112906378A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 刘恺;沈丹婷;杨勇 | 申请(专利权)人: | 北京信聚知识产权有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06F16/31;G06F16/33;G06F16/383 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 董涛 |
地址: | 100193 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 辅助 文本 生成 方法 设备 存储 介质 | ||
本发明公开了用于辅助文本生成的方法和设备与存储介质。该用于辅助文本生成的方法包括:获取对象集合,其中,所述对象集合包括多个对象;抽取所述多个对象中的多个第一文本,并选取所述多个第一文本中的多个第二文本;利用映射表将所述多个第二文本组合以生成组合文本。
技术领域
本公开的实施例涉及文本处理领域,特别涉及一种用于辅助文本生成的方法和设备与存储介质。
背景技术
发明人在发明创造过程中,会耗费好多时间构建想法idea。并即使在有了idea之后也非常难落在纸面上或者形成文档,更别提提供一份高质量的技术交底书了。技术交底书,是发明人把他的专利技术构思写下来,供专利代理人撰写专利说明书时参考的技术文档,也是发明人与代理人之间沟通的基本素材和基础。简单地说,技术交底书就是发明人把脑袋里的构思变成文字的结果。
现有技术中,并没有任何技术可以自动生成技术交底书;也更没有在自动生成技术交底书基础上,还为研发人员提供参考信息,以使研发人员进一步完善形成高质量的技术交底书,即现有技术中并不存在辅助研发人员如果形成高质量技术交底书的技术。
发明内容
本公开至少一个实施例提供了用于辅助文本生成的方法和设备与存储介质。该用于辅助文本生成利用组合发明原则,基于用户输入的短短一段idea描述自动生成技术交底书,取得了快速生成技术交底书、并为研发人员提供参考信息,以使研发人员进一步完善形成高质量的技术交底书的有益效果。
根据本公开的第一方面,至少一个实施例提供了用于辅助文本生成的方法,所述方法包括:获取对象集合,其中,所述对象集合包括多个对象;抽取所述多个对象中的多个第一文本,并选取所述多个第一文本中的多个第二文本;利用映射表将所述多个第二文本组合以生成组合文本。
结合第一方面及其上述实现方式,获取对象集合包括:获取输入信息,其中,所述输入信息为输入文本;利用关键词检索和/或语义检索,得到与所述输入文本相关的多个对象。
结合第一方面及其上述实现方式,利用关键词检索得到与所述输入文本相关的多个对象包括:获取输入文本中的多个关键词;通过Elasticsearch到第一数据库检索与所述输入文本相关的多个专利对象,其中,所述第一数据库存储有经结巴分词的多个待检索专利对象,所述Elasticsearch根据所述结巴分词建立的词语索引对所述多个待检索专利对象进行全文检索。
结合第一方面及其上述实现方式,所述Elasticsearch被安装在多块SSD硬盘组成的raid0硬盘空间上。
结合第一方面及其上述实现方式,利用语义检索得到与所述输入文本相关的多个对象包括:利用第一语义检索得到与所述输入文本相关的多个对象,其中,利用第一语义检索得到与所述输入文本相关的多个对象包括:截取输入文本中的句文本;到第二数据库匹配与所述句文本的向量欧式距离低于阈值的多个第二向量,其中,所述向量采用WordEmbedding和TF-IDF结合的方式来表示语义,所述第二数据库存储有多个待匹配专利对象的多个第一向量,所述多个第一向量包括所述多个第二向量;得到与所述多个第二向量对应的多个专利对象;和/或利用第二语义检索得到与所述输入文本相关的多个对象,其中,利用第二语义检索得到与所述输入文本相关的多个对象包括:到第三数据库匹配与所述输入文本的向量欧式距离低于阈值的多个第三向量,其中,所述向量采用Word Embedding和TF-IDF结合的方式来表示语义,所述第三数据库存储有多个待匹配专利对象的多个第四向量,所述多个第四向量包括所述多个第三向量;得到与所述多个第三向量对应的多个专利对象。
结合第一方面及其上述实现方式,所述对象包括第一部分、第二部分和第三部分,其特征在于,抽取所述多个对象中的多个第一文本包括:抽取所述多个对象的多个第一部分中多个第一部分对象文本;抽取所述多个对象的多个第二部分中多个第二部分对象文本;抽取所述多个对象的多个第三部分中多个第三部分对象文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信聚知识产权有限公司,未经北京信聚知识产权有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110346620.0/2.html,转载请声明来源钻瓜专利网。