[发明专利]基于二次人工智能算法的景区评估方法及模型在审
| 申请号: | 201911363789.6 | 申请日: | 2019-12-26 |
| 公开(公告)号: | CN111160756A | 公开(公告)日: | 2020-05-15 |
| 发明(设计)人: | 陈勇良 | 申请(专利权)人: | 马上游科技股份有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06F16/36;G06F16/25 |
| 代理公司: | 宁波瑞元智产专利代理事务所(特殊普通合伙) 33351 | 代理人: | 伊灵聪 |
| 地址: | 212009 江苏省镇江市新区智慧大道468号*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 二次 人工智能 算法 景区 评估 方法 模型 | ||
本发明公开了一种基于二次人工智能算法的景区评估方法及模型,涉及人工智能技术领域,解决了景区评估模型不够客观实时性较差的技术问题,其技术方案要点是通过大数据的批处理方式对数据进行标准化处理,再通过“两层”机器学习,第一层即监督机器学习,使用Bert自然语言处理模型解决常规的自然语言处理,第二层是无监督机器学习,解决剩余无法标记的部分评论的分类和标签建立;再融合知识图谱技术,大数据技术等将景区评论数据进行序列化、语义解析、向量化,构建无监督机器学习的评估特征库,从而构建基于评论数据的高效、精准的景区评估模型。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种基于二次人工智能算法的景区评估方法及模型。
背景技术
当前景区评估体系常用的方法有两种,一是采用多维数据分析手段针对不同景区类型预设评估指标体系,从区域条件、环境、交通、经济发展、客源等多个维度进行交叉分析评估;二是基于游客评价的分词技术通过词频计算游客对景区的满意度,即“情感分析”,它在一定程度上具备客观的量化分析能力,利用监督学习在自然语言识别的基础上,通过预设规则评估游客的满意度情况,但它的重心还是在游客体验,更多的是游客分析。
上述两种方法的主要缺陷在于:1)需要支撑的数据量多,且所需数据的行业跨度大(景区、酒店、交通、运营商等),数据整合及获取难度大。2)景区相关维度较多,例如时间、气象、位置、服务、价格、交通、设施设备、规模、景区类型、安全、管理、消防等,并且数据分布极为稀疏,增加了分析难度也严重影响了计算效率。3)所谓“情感分析”实质是基于游客分析,只能从单一方面反映景区情况,另外,虽然采用了监督学习手段,仍然比较依赖人工根据行业经验去提取特征库,因此分析略显粗浅,难以做到公正、客观、全面、精准地评估;同时,景区评论数据带有很强的主观性(例如刷屏、刷单)、多意性、随意性和难以量化等特性,例如有些频次低的数据反而更能反映问题,若采用常规的“数据清洗”就很容易作为异常值给排除,还有同样的字、词、符号放在不同的语境中可能是相反的两个意思,在这些场景下,原有的评估方式难以实现对景区的正确评估。4)不能分析识别并输出景区“好”与“不好”的具体原因。
发明内容
本公开提供了一种基于二次人工智能算法的景区评估方法及模型,其技术目的是:实现自动化、系统化、全面的、客观的、可逆的、动态的基于评论数据的景区评估方法及模型,并输出景区优劣的具体原因。
本公开的上述技术目的是通过以下技术方案得以实现的:
一种基于二次人工智能算法的景区评估方法,包括:
获取数据后进行预处理;
将预处理后的数据分为训练集数据、验证集数据和测试集数据,并将符合正态分布的训练集数据进行分组;
将分组后的训练集数据逐步输入到第一Bert自然语言处理模型分别进行特征处理和模型训练,所述特征处理得到分类器模型和特征向量,所述模型训练得到第一景区评估模型和所述训练集数据的第一标记结果;
将所述第一Bert自然语言处理模型无法标记的训练集数据分别通过知识图谱技术和无监督机器学习进行分类,分别得到第二标记结果和第三标记结果,其中,所述无监督机器学习采用极大似然估计的算法;
将所述第一标记结果、第二标记结果和第三标记结果输入到第二Bert自然语言处理模型进行训练,得到预训练模型;
将所述预训练模型、分类器模型、特征向量和第一景区评估模型进行模型嵌入后相互监督学习,得到第二景区评估模型。
进一步地,所述预处理的方法为ETL,通过ETL进行数据清洗和数据标准化。
进一步地,所述分类器模型包括序列标注模型、双句分析模型和单句分析模型。
进一步地,所述特征向量包括字/词/符号向量、句向量、文本向量和位置向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上游科技股份有限公司,未经马上游科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911363789.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





