基于深度学习的流行音乐“快乐因子”提取研究毕业论文

 2021-04-10 10:04

摘 要

近年来,自动音乐推荐系统被广泛应用于音乐软件中,这有助于以数字方式销售和消费更多的音乐。大多数的推荐系统采用了协同过滤算法来为用户推荐可能感兴趣的音乐,但这种算法受限于冷启动的困扰:缺乏使用数据的对象将无法被应用于算法中。因此,许多新推出的音乐或者是较为冷门的音乐难以得到推荐。在本文中,我们尝试使用音乐本身的内容数据来提取音乐的特征,从而在无法获得使用数据的基础上对不同情感导向的音乐做出区分。深度学习是一种模拟人脑对数据的处理,从低层到高层逐步进行特征提取组合的机器学习方法,在数据分类上有较好的表现。我们使用了深度学习中的卷积神经网络来进行实验,采用音乐的频谱图作为实验数据。实验使用已存在的AlexNet进行迁移学习的方法和新编写的神经网络进行学习的方法来对音乐的频谱图进行基于音乐情感导向的分类。实验表明,使用频谱图对音乐的情感导向进行预测取得了不错的准确率,证明这一方法是可行的,尽管在事实上,影响人们对音乐的情感判断与偏好的特征与相应的频谱之间存在较大的语义差距。

关键词:深度学习;流行音乐;特征提取;

Research of Extracting Factor of Happiness from Pop Music Based-on Deep Learning

ABSTRACT

Automatic music recommendation system is widely using in music software in recent years. This will promote the consumption of digital music. Most recommendation systems take collaborative filtering as their algorithm to recommend music to users. However, this algorithm suffers from cold start problem: it cannot work when there is no available usage data. Therefore, new songs and unpopular songs will not get recommendation. In this paper, we attempt to use data from music audio to extract the feature of music and to distinguish the emotion of music which we cannot get its usage data. Deep learning is a way of machine learning that imitates human brain to deal with data and extract the feature from low level to high. We use convolution neural network from deep learning and spectrogram to make experiments. The experiment of classification on music by emotion uses two different ways. The one is transfer learning using AlexNet. Another one is using new network. We get acceptable accuracy of classification on music in this experiment. We show that using spectrogram to predict emotional tendency is feasible, despite the fact that there is a large semantic gap between the characteristics of a song that affect user’s decision and preference and the spectrogram of music.

Key words:pop music;deep learning;feature extraction;

目 录

1 绪论………………………………………………………………………………………1

2 卷积神经网络………………………………………………………………………………3

2.1 介绍……………………………………………………………………3

2.2 实验用网络结构…………………………………………………………………………4

3 数据集………………………………………………………………………………6

4 实验………………………………………………………………………………8

4.1 AlexNet迁移学习……………………………………………………………………8

4.2 CNN-a…………………………………………………………………………9

4.3 CNN-b……………………………………………………………………10

4.4 数据验证……………………………………………………………………12

4.5 部分卷积核的可视化……………………………………………………………………13

5结论………………………………………………………………………………17

……………………………………………………………………………………………………………

致谢……………………………………………………………18

参考文献………………………………………………………19

1 绪论

近年来,随着网络在人们生活中占据越来越重的分量,音乐产业也在逐步从实体光碟向数字版权发展。在线音乐商店,如iTunes,Google Play,网易云音乐,QQ音乐,虾米音乐成为了人们听音乐的首选。音乐自动推荐算法在其中扮演了重要的角色,它可以向用户提供可能感兴趣的音乐内容,从而使商家能够更好的对用户做出定位,提供更有针对性的服务。因为要做出推荐,那么自然需要对音乐进行标签和分类工作,而支持标签和分类工作的基础则是对音乐进行特征的提取和分析,这是一项具有挑战性的任务。

传统上,在线音乐商店使用协同过滤算法为用户进行推荐。协同过滤算法的原理是根据使用数据来确定用户的喜好,例如两位用户的音乐收藏列表中有许多相同的歌曲,那么这两位用户的口味可能就是相同的。或者,两首歌曲被同一组用户收藏,那么这两首歌曲可能是相似的。基于这些信息,算法为用户提供推荐。

协同过滤算法的推荐系统已经被广泛研究。但是,音乐推荐的问题上,不同风格和流派,不同的情感导向,以及用户的社会地理因素让问题变得复杂。可以推荐的“相似歌曲”往往是非常大的数目。我们可以通过指定音乐创作者或歌手的形式来获得特定方向的推荐,但即使如此也必须意识到,艺术家创作并非完全的同质化,用户可能只喜欢一位歌手演唱的某种特定风格的歌曲,而对这位歌手演唱的其他风格的歌曲不感兴趣。此外,协同过滤算法依赖于使用数据,这会导致流行的歌曲比冷门的歌曲得到更多的推荐,因为前者有大量的使用数据支持。这并不是我们希望的结果,因为这样的推荐往往结果可以预知,且很有可能推荐了许多用户早已知晓的歌曲。我们更希望推荐系统能够推荐给用户新的歌曲。

您需要先支付 80元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,优先添加企业微信。