[发明专利]一种基于关键词的问卷配置方法、系统、设备和介质有效
申请号: | 202110581503.2 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113032574B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 姚娟娟;钟南山;樊代明 | 申请(专利权)人: | 明品云(北京)数据科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/186 |
代理公司: | 上海汉之律师事务所 31378 | 代理人: | 冯华 |
地址: | 102400 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键词 问卷 配置 方法 系统 设备 介质 | ||
本发明提出一种基于关键词的问卷配置方法、系统、设备和介质,包括:获取指定领域的问卷信息,构建问卷样本集;获取所述问卷样本集中每个问卷样本包含的多个子问题,根据各所述子问题对应的关键特征创建对应问卷样本的特征链,对各问卷样本对应的特征链进行聚类,获取多个特征类库;创建问题库,并将所述问卷样本集包含的所有子问题录入问题库;输入配置文本,根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链后,从所述问题库中获取与修正后的特征链匹配的子问题,生成所述配置文本对应的问卷信息;本发明可快速高效地进行问卷信息整合配置,操作简单便捷。
技术领域
本发明涉及文本数据处理领域,尤其涉及一种基于关键词的问卷配置方法、系统、设备和介质。
背景技术
结果调研广泛应用于各个领域,无论是产品的使用效果反馈还是诊断检查的跟进调研都对生产商或相关机构的后续活动开展至关重要,目前调研主要采用问卷交互的方式获取反馈结构,由于问卷类别和形式的多样化,很难形成统一的模板。针对每个类别的问卷安排专人管理,无疑增加人工成本,且查找使用费时费力。此外由于信息更新速度快,部分内容无法长期适用,重新制作或查找现有的进行修改都需要耗费大量时间,效率低,可操作性差。
发明内容
鉴于以上现有技术存在的问题,本发明提出一种基于关键词的问卷配置方法、系统、设备和介质,主要解决现有调查问卷配置效率低,适用性差的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种基于关键词的问卷配置方法,包括:
获取指定领域的问卷信息,构建问卷样本集;
获取所述问卷样本集中每个问卷样本包含的多个子问题,根据各所述子问题对应的关键特征创建对应问卷样本的特征链,对各问卷样本对应的特征链进行聚类,获取多个特征类库;
创建问题库,并将所述问卷样本集包含的所有子问题录入问题库;
输入配置文本,根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链后,从所述问题库中获取与修正后的特征链匹配的子问题,生成所述配置文本对应的问卷信息。
可选地,根据每个问卷样本中各子问题的排布顺序,将子问题对应的关键特征串接生成特征链;或,
每个子问题对应一个节点,每个节点按照子问题的排布顺序依次连接,形成特征链,其中,每个节点包含一个或多个关键特征。
可选地,将所述问卷样本集包含的所有子问题录入问题库,包括:
预先标注每个问卷样本的类别信息,并将所述类别信息作为每个问卷样本对应子问题的识别标识;
根据所述识别标识对各子问题进行分类,得到多个子问题集合,将所述子问题集合录入问题库。
可选地,根据所述配置文本对应特征从所述特征类库中获取匹配的特征链,修正所述匹配的特征链,包括:
获取所述配置文本对应的一个或多个关键词,构建关键词集合;
将所述关键词集合与特征类库中的特征链进行相似度比对,获取一个或多个匹配的特征链;
将所述一个或多个匹配的特征链中包含的关键特征进行组合调整,得到修正后的特征链,其中,组合调整包括:合并关键特征、调整关键特征的结构位置和/或增删关键特征。
可选地,将所述关键词集合与特征类库中的特征链进行相似度比对,获取一个或多个匹配的特征链,包括:
将所述关键词集合中各关键词对应的特征向量与特征链中各关键特征进行逐一比对,按照关键词特征向量与关键特征的匹配数量对特征链进行排序,并从排序结果中选出指定数量的特征链作为匹配特征链输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于明品云(北京)数据科技有限公司,未经明品云(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110581503.2/2.html,转载请声明来源钻瓜专利网。