[发明专利]一种基于关键词的问卷配置方法、系统、设备和介质有效
申请号: | 202110581503.2 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113032574B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 姚娟娟;钟南山;樊代明 | 申请(专利权)人: | 明品云(北京)数据科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/186 |
代理公司: | 上海汉之律师事务所 31378 | 代理人: | 冯华 |
地址: | 102400 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键词 问卷 配置 方法 系统 设备 介质 | ||
1.一种基于关键词的问卷配置方法,其特征在于,包括:
获取指定领域的问卷信息,构建问卷样本集;
获取所述问卷样本集中每个问卷样本包含的多个子问题,根据各所述子问题对应的关键特征创建对应问卷样本的特征链,对各问卷样本对应的特征链进行聚类,获取多个特征类库,包括:根据每个问卷样本中各子问题的排布顺序,将子问题对应的关键特征串接生成特征链;或,每个子问题对应一个节点,每个节点按照子问题的排布顺序依次连接,形成特征链,其中,每个节点包含一个或多个关键特征;
创建问题库,并将所述问卷样本集包含的所有子问题录入问题库,包括:将所述问卷样本集包含的所有子问题录入问题库,包括:预先标注每个问卷样本的类别信息,并将所述类别信息作为每个问卷样本对应子问题的识别标识;根据所述识别标识对各子问题进行分类,得到多个子问题集合,将所述子问题集合录入问题库;
输入配置文本,根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链,包括:获取所述文本对应的一个或多个关键词,构建关键词集合;将所述关键词集合与特征类库中的特征链进行相似度比对,获取一个或多个匹配的特征链,将所述关键词集合中各关键词对应的特征向量与特征链中各关键特征进行逐一比对,按照关键词特征向量与关键特征的匹配数量对特征链进行排序,并从排序结果中选出指定数量的特征链作为匹配特征链输出;将所述一个或多个匹配的特征链中包含的关键特征进行组合调整,得到修正后的特征链,其中,组合调整包括:合并关键特征、调整关键特征的结构位置和/或增删关键特征;根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链后,从所述问题库中获取与修正后的特征链匹配的子问题,生成所述配置文本对应的问卷信息。
2.根据权利要求1所述的基于关键词的问卷配置方法,其特征在于,从所述问题库中获取与修正后的特征链匹配的子问题,生成所述配置文本对应的问卷信息,包括:
通过修正后的特征链匹配所述识别标识,获取对应的子问题集合;
将修正后的特征链中每个关键特征与获取的子问题集合中各子问题进行比对,获取匹配的子问题,并按照关键特征在特征链中的排布,设置对应子问题的排布结构,生成问卷信息。
3.根据权利要求2所述的基于关键词的问卷配置方法,其特征在于,当子问题集合中没有与关键特征匹配的子问题时,增设关键特征对应的子问题,并将增设的子问题用于更新对应的子问题集合。
4.一种基于关键词的问卷配置系统,其特征在于,包括:
样本获取模块,用于获取指定领域的问卷信息,构建问卷样本集;
特征类库创建模块,用于获取所述问卷样本集中每个问卷样本包含的多个子问题,根据各所述子问题对应的关键特征创建对应问卷样本的特征链,对各问卷样本对应的特征链进行聚类,获取多个特征类库包括:根据每个问卷样本中各子问题的排布顺序,将子问题对应的关键特征串接生成特征链;或,每个子问题对应一个节点,每个节点按照子问题的排布顺序依次连接,形成特征链,其中,每个节点包含一个或多个关键特征;
问题库创建模块,用于创建问题库,并将所述问卷样本集包含的所有子问题录入问题库,包括:将所述问卷样本集包含的所有子问题录入问题库,包括:预先标注每个问卷样本的类别信息,并将所述类别信息作为每个问卷样本对应子问题的识别标识;根据所述识别标识对各子问题进行分类,得到多个子问题集合,将所述子问题集合录入问题库;
问卷配置模块,用于输入配置文本,根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链,包括:获取所述文本对应的一个或多个关键词,构建关键词集合;将所述关键词集合与特征类库中的特征链进行相似度比对,获取一个或多个匹配的特征链,将所述关键词集合中各关键词对应的特征向量与特征链中各关键特征进行逐一比对,按照关键词特征向量与关键特征的匹配数量对特征链进行排序,并从排序结果中选出指定数量的特征链作为匹配特征链输出;将所述一个或多个匹配的特征链中包含的关键特征进行组合调整,得到修正后的特征链,其中,组合调整包括:合并关键特征、调整关键特征的结构位置和/或增删关键特征;根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链后,从所述问题库中获取与修正后的特征链匹配的子问题,生成所述配置文本对应的问卷信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于明品云(北京)数据科技有限公司,未经明品云(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110581503.2/1.html,转载请声明来源钻瓜专利网。