[发明专利]自然语言编程方法、装置、设备及存储介质在审
申请号: | 202110661769.8 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113535144A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 袁行远;肖达 | 申请(专利权)人: | 北京彩彻区明科技有限公司 |
主分类号: | G06F8/30 | 分类号: | G06F8/30;G06F8/41;G06F40/279;G06F40/56;G06N3/04;G06N3/08 |
代理公司: | 北京中原华和知识产权代理有限责任公司 11019 | 代理人: | 孙磊;徐民 |
地址: | 100083 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 编程 方法 装置 设备 存储 介质 | ||
本发明涉及一种自然语言编程方法、装置、设备及存储介质,该方法包括:接收用户输入的自然语言描述的目标场景,所述目标场景包括人物和目标任务;将所述目标场景输入至预先训练好的语言模型;利用所述语言模型,生成与所述人物执行所述目标任务的结果对应的文本,作为编程结果文本。利用本发明的自然语言编程方法,实现了利用自然语言来进行编程。
技术领域
本发明涉及计算机技术领域,特别是涉及一种自然语言编程方法、装置、设备及存储介质。
背景技术
此处的陈述仅提供与本发明有关的背景信息,而不必然地构成现有技术。
为了驱动计算机运行,需要编程语言。例如,为了驱动计算机进行加法运算,需要告诉计算机1+1=,然后计算机进行运行得到2。最初图灵设计了一个纸带模型,通过打孔纸带编码0和1,给计算机输入指令。后来形成了汇编语言,把指令用单词简单记忆,例如ADD 11,表示1+1。再后来人们觉得汇编语言还是麻烦,就形成了高级语言,比如C语言和Python。编程语言越来越简单,越来越接近自然语言,但是还是需要用户学习和理解才能够使用。
另一方面,计算机语言多数需要英文编码,对其他语言很不友好,很多国家的用户不能使用自己的语言来编程。于是有几种中文编程的方式问世,比如“周蟒”和文言编程,可以用中文编程。作为利用“周蟒”编程的一个例子,输入:
印出'哈啰,世界'
则在执行上述指令后会在屏幕上展示“哈啰,世界”的文字。作为利用文言编程的一个例子,输入:
吾有一言曰“问天地好在”书之
则在执行上述指令后会输出“问天地好在”。
另外,传统的编程语言都需要遵守严格的语法,些许语法错误就会造成运行错误。并且传统的编程语言无法直接理解复杂的工作,例如编写一个春联,对我们人类很容易理解,对于计算机而言却并非如此。
发明内容
本发明的目的在于提供一种新的编程方法、装置、设备及存储介质,实现利用自然语言来进行编程。
本发明的目的采用以下技术方案来实现。依据本发明提出的一种自然语言编程方法,包括以下步骤:接收用户输入的自然语言描述的目标场景,所述目标场景包括人物和目标任务;将所述目标场景输入至预先训练好的语言模型;利用所述语言模型,生成与所述人物执行所述目标任务的结果对应的文本,作为编程结果文本。
本发明的目的还可以采用以下的技术措施来进一步实现。
前述的自然语言编程方法,在训练所述语言模型的过程中,输入至所述语言模型的训练数据包括大规模的自然语言描述的场景,所述场景包括人物和任务。
前述的自然语言编程方法,在训练所述语言模型的过程中,输入至所述语言模型的训练数据包括目标文体的语料;其中,所述目标文体的语料包括小说语料、故事语料和/或新闻语料。
前述的自然语言编程方法,在将所述训练数据输入至所述语言模型进行训练之前,还包括,将所述训练数据拆分为多个子训练数据,以区分不同场景。
前述的自然语言编程方法,所述将所述训练数据拆分为多个子训练数据包括:识别语料中的地点词、和/或时间词、和/或章节分隔词,其中,所述章节分隔词用于描述章、节、回、幕的起始或终结;根据所述地点词、和/或所述时间词、和/或所述章节分隔词,将所述语料的内容切分为多个部分,每个部分作为一个所述子训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京彩彻区明科技有限公司,未经北京彩彻区明科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110661769.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种橇体定位装置
- 下一篇:一种智能家居的物联网自动无人测试场