[发明专利]音乐知识图谱半自动构建方法及系统在审

专利信息
申请号: 202210108955.3 申请日: 2022-01-28
公开(公告)号: CN114547330A 公开(公告)日: 2022-05-27
发明(设计)人: 闫伟;季增彦;张亮;卜凡洋;隋远 申请(专利权)人: 山东师范大学
主分类号: G06F16/36 分类号: G06F16/36;G06F40/295;G06N3/04;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 黄海丽
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音乐 知识 图谱 半自动 构建 方法 系统
【权利要求书】:

1.音乐知识图谱半自动构建方法,其特征是,包括:

对中文音乐领域数据集的命名实体进行识别;

将识别出来的命名实体,转换成中文音乐领域的三元组;

基于中文音乐领域的三元组,构建中文音乐领域的知识图谱。

2.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,所述方法还包括:

基于中文音乐领域的知识图谱,实现音乐数据的个性化推荐或者音乐数据的搜索。

3.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,对中文音乐领域数据集的命名实体进行识别;具体包括:

采用训练后的神经网络模型,对中文音乐领域数据集的命名实体进行识别;

神经网络模型,具体网络结构包括:

依次连接的卷积神经网络CNN、双向长短词记忆模型BiLSTM、自注意力机制层Self-Attention和CRF层;

所述训练后的神经网络模型,具体训练过程包括:

构建训练集;其中,训练集为已知命名实体的语料库;

将训练集输入到神经网络模型中,对模型进行训练,得到训练后的神经网络模型。

4.如权利要求3所述的音乐知识图谱半自动构建方法,其特征是,所述采用训练后的神经网络模型,对中文音乐领域数据集的命名实体进行识别;具体工作原理包括:

将中文音乐领域语料库中的每个对话,转换成向量矩阵;

使用卷积神经网络CNN,对向量矩阵进行特征提取,得到每个对话的本质特征;

将每个对话的本质特征,输入到双向长短词记忆模型BiLSTM中,输出包含上下文特征表示的单词特征;

将包含上下文表示的单词特征,输入到自注意力机制层,筛选出关键实体;

将筛选出的关键实体,输入到CRF层,得到实体标签。

5.如权利要求4所述的音乐知识图谱半自动构建方法,其特征是,将中文音乐领域语料库中的每个对话,转换成向量矩阵;具体包括:

删除每个对话的停用词;

将每个对话中断开的句子连接到一起;

删除每个对话中句子之间的空格;

将每个对话中句子控制在设定长度;

对话中的每个句子对应一个索引向量;

对话中每个句子中的每个单词,对应单词向量;

得到每个对话对应的向量矩阵。

6.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,将识别出来的命名实体,转换成中文音乐领域的三元组;具体包括:

根据预定义的关系模板,将识别出来的命名实体,将实体与实体之间用关系连接起来,转换成中文音乐领域的三元组;

所述预定义的关系模板,包括:歌曲名称与作者的关系,歌曲名称与歌词的关系;

将识别出来的命名实体,转换成中文音乐领域的三元组,具体包括:

提取出每句话中的实体,所述实体,包括:歌手、歌曲和歌词;如果实体之间的关系在预定义关系库中被定义,则最终返回三元组集合[第一实体,关系,第二实体]。

7.如权利要求1所述的音乐知识图谱半自动构建方法,其特征是,

基于中文音乐领域的三元组,构建中文音乐领域的知识图谱;具体包括:

将音乐三元组放到知识图谱生成算法中,自动形成知识图谱,并且链接到图形数据库Neo4j,生成为可视化的知识图谱;

在图形数据库Neo4j中,遍历三元组集合中每一个三元组,以第一实体与第二实体,利用cypher语言去掉重复的创建两个节点,并以第一实体与第二实体的关系作为关联利用cypher语言连接两个节点;所构建的知识图谱将存储在Neo4j数据库中。

8.音乐知识图谱半自动构建系统,其特征是,包括:

实体识别模块,其被配置为:对中文音乐领域数据集的命名实体进行识别;

三元组转换模块,其被配置为:将识别出来的命名实体,转换成中文音乐领域的三元组;

图谱构建模块,其被配置为:基于中文音乐领域的三元组,构建中文音乐领域的知识图谱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210108955.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top