[发明专利]对机器人进行训练的方法在审
申请号: | 201910303688.3 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110019688A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 艾肯特公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 于小宁 |
地址: | 开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表达数据 对照表 机器人 训练数据库 意图数据 比对 配对数据 配对 写入 发现 | ||
一种对机器人进行训练的方法,其中,包括:用训练数据库中的表达数据与意图数据的正确配对数据来对机器人进行训练;机器人对这些表达数据进行理解,将理解结果与正确配对的意图数据进行对比,找到理解错误的表达数据;将理解错误的表达数据及与其对应的意图数据写入独立于训练数据库的对照表,其中,机器人在以后进行理解时先将所要理解的表达数据与对照表中的表达数据进行比对,如果发现该表达数据在对照表中,则直接通过对照表找到对应的理解结果,如果在对照表中没有找到该表达数据,那么再在训练数据库中进行比对。
技术领域
本发明涉及一种智能机器人技术,具体而言,涉及一种对机器人进行训练的方法,以及采用了该机器人训练方法的自然表达处理及回应设备和人机交互系统。
背景技术
目前常用的机器智能(MI,Machine Intelligence)技术主要包括人工智能(AI,Artificial Intelligence)技术。其中比较常见的有基于人工智能的自然语言处理(NLP,Natural Language Processing)技术。
对基于人工智能的自然语言处理(也可简称为AI-NLP)而言,对于所处理的语音,需要从语音先转文本,再通过已建立的语法模型和语义模型来实现语义的理解。不过,这种方法受制于语音识别器的准确率。例如,一个句子有10个字,语音识别器能够实现90%的准确度,但如果错误发生在关键词(字),那么现有的AI-NLP技术便无法实现正确的语义理解。特别地,在噪音环境下,由于语音识别器的准确率会下降,所以要用AI-NLP技术准确地进行语义理解的难度也更高了。另一方面,由于AI-NLP需要人工构建海量的语法模型和语义模型,因而会产生极大的人工成本。事实上,目前世界上从事AI-NLP技术研发和应用的主要企业均有数千甚至更多的员工从事语音的人工标注和模型构建。
基于机器智能的人机交互系统通常都需要利用数据对机器理解模型进行训练,而训练的效果会直接影响机器理解的准确度。
发明内容
根据本发明的一个方面,提供了一种基于自然智能的自然表达处理方法,其中,包括:接收自然表达的输入,得到具有第一信息颗粒度的第一语言信息,将第一语言信息转换为具有第二信息颗粒度的第二语言信息,其中,第二信息颗粒度的数量级介于第一信息颗粒度的数量级与文字的信息颗粒度的数量级之间,将第二语言信息转换为第三语言信息,第三语言信息作为对自然表达进行理解的结果,其中,第二语言信息和与该第二语言信息对应的第三语言信息作为配对数据被存储在数据库,对于数据库中已有的成对的第二语言信息和第三语言信息,将该第二语言信息的元素的各种排列组合与该第三语言信息或者该第三语言信息的元素的各种排列组合进行循环迭代,建立第二语言信息的元素的各种排列组合与第三语言信息或第三语言信息的元素的各种排列组合之间的对应关系,获得更多的第二语言信息与第三语言信息的配对数据,并存储在数据库中。
根据本发明实施例的基于自然智能的自然表达处理方法,其中,当从输入的第一语言信息获得第二语言信息后,将该第二语言信息与数据库中已有的第二语言信息进行比较,然后根据比较结果来确定与该第二语言信息对应的第三语言信息,或者计算将该第二语言信息对应到某第三语言信息的正确率,如果机器理解能力不够成熟,不足以或者不确定将该第二语言信息转换到某条第三语言信息,那么进行人工辅助理解,通过人工对输入的第一语言信息进行理解,得到与自然表达的含义所对应的第三语言信息,并且将从该第一语言信息得到的第二语言信息与第三语言信息对应起来或者将第一语言信息与第三语言信息对应起来,得到新的配对数据存入数据库。
根据本发明实施例的基于自然智能的自然表达处理方法,其中,对于新的第二语言信息与第三语言信息的配对数据或者新的第一语言信息与第三语言信息的配对数据,将其中的第二语言信息或者由第一语言信息转换得到的第二语言信息的元素的各种排列组合与其中的第三语言信息或者该第三语言信息的元素的各种排列组合进行循环迭代,建立第二语言信息的元素的各种排列组合与第三语言信息或第三语言信息的元素的各种排列组合之间的对应关系,获得更多的第二语言信息与第三语言信息的配对数据,并存储在数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾肯特公司,未经艾肯特公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910303688.3/2.html,转载请声明来源钻瓜专利网。