您现在的位置是:首页 > 音乐 >

音乐

基于多模态的音乐推荐系统

Qqpoi2024-05-10 06:59:32音乐307
孙渊-距离 陈绮贞2022年4月18日发(作者:回家 顺子)DOI:10.13878/j.cnki.jnuist.2019.01.013龚志1 邵曦1基于多模态的音乐推荐系统0 引言  随着物质生活水平的不断提高,人们对文化产品尤其是高品质音乐产品的需求日渐提高.借由互联网规模的扩大和数字存储技术的进步桃花坞里桃花庵,音乐产业不断发展分手旅行,音乐数量也以几何级数激增.一方面,网络中海量音乐资源出

孙渊-距离 陈绮贞

基于多模态的音乐推荐系统
2022年4月18日发
(作者:回家 顺子)

DOI:10.13878/j.cnki.jnuist.2019.01.013

龚志

 邵曦

基于多模态的音乐推荐系统

0 引言

  随着物质生活水平的不断提高,人们对文化产品尤其是高品质

音乐产品的需求日渐提高.借由互联网规模的扩大和数字存储技术的

进步桃花坞里桃花庵,音乐产业不断发展分手旅行,音乐数量也以几何级数激增.一方面,网络

中海量音乐资源出现了信息过载现象黑暴雨,这些音乐通过自身携带的标

签(如演唱者、年代、音乐流派等)与其他音乐进行区分彩虹桥,但这种分类

标准不统一且缺乏开放性;另一方面杨幂的歌,用户被这些海量音乐所包围

着,传统的检索方式无法满足用户需求西拉 歌手,无法从中有效获取自己所需

的音乐资源.

推荐系统作为一种“信息推送”模式,是解决信息过载问题的主

要手段鸟叫声下载,它能够在分析预测用户需求的基础上主动推送其可能需要

但又无法获取的有用信息,并能够以用户为中心,通过研究用户行

为、兴趣和环境等,为用户推荐更具针对性的信息斗战神背景音乐,即实现信息的“按

需定制服务”

[1]

.然而,目前绝大部分已成熟商用的推荐系统都采用了

传统的基于协同过滤的推荐方式,该方法忽视了音乐内容本身,无法

满足用户的实际需求.通过进一步研究发现狼吻酷族,将融合音乐的音频特征

与歌词信息的多模态特征作为协同推荐方式的补充,可使音乐推荐

的结果更加客观与准确.所以,本文提出了一种基于多模态的音乐推

荐系统,在进行音乐推荐时使用音乐的多模态特征来提高协同推荐

的准确率.

多模态音乐推荐系统框架如图1所示.

摘要

使用传统协同过滤的方式进行推荐

往往会忽视音乐底层特征.通过将音乐

的音频特征与歌词信息进行多模态融

合,并将融合后的特征信息作为协同过

滤推荐的补充,提出了一种基于多模态

的音乐推荐系统.主要探讨了音频特征

与歌词信息的提取我喜欢你网剧,并在提取歌词信息

时利用LDA主题模型进行特征降维.针

对多模态融合问题,使用一种特征级联

早融合法(EFFC)融合方式中国好声音李代沫我的歌声里,并将多模态

融合后的结果与单模态结果进行了比

较.对于结果的推荐,以多模态特征信息

为依据建立用户兴趣模型bigbang一天一天mv,并将该模型

通过LSTM神经网络,以过滤与优化协同

推荐的用户组.结果表明julia,基于多模态的

音乐推荐系统将推荐结果的误差项平方

和(SSE)由传统的2􀆰009降至0􀆰3886,验

证了该方法的有效性.

关键词

音乐推荐;协同过滤;LDA主题模

型;多模态融合;LSTM神经网络

中图分类号TN912

文献标志码A

1 协同过滤与用户兴趣模型

息推荐和信息服务领域的研究热点

[2]

.该方法主要通过用户之间的相

收稿日期2018⁃04⁃27

资助项目国家自然科学基金(70573025)

作者简介

龚志stickout,男,硕士生,研究方向为多媒体信息

系统.783586264@qq.com

邵曦(通信作者)我们不是相爱吗mp,男,博士,副教授,研究

方向为多媒体信息系统与基于内容的音乐信

息检索.shaoxi@

njupt.edu.cn

1南京邮电大学通信与信息工程学院宋冬野 安河桥,南京,

210003

协同过滤技术是信息推荐系统中最为成功的技术之一和我来电,也是信

互协同来选择有价值的信息,比如利用用户之间对资源的评分进行

推荐歌手亚东,目前比较具有代表性的是基于用户的协同过滤推荐方法.

基于用户的协同过滤推荐方法the l word,首先计算出目标用户与其他用

户的相似度,在用户社区中到与目标用户最相似的部分用户(邻

居),再由邻居用户对指定音乐的评分来预测目标用户对该资源的评

分,从而产生推荐结果.

基于用户的协同过滤推荐方法的核心就是计算用户之间的相似

度.假设:U

{U

,U

,…梁静茹上海演唱会,U

}是所有用户的集合,I

{I

,I

,…,I

Copyright©博看网htsReserved闭嘴花美男乐队1.

学报(自然科学版),2019,11(1):68⁃76

JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition)江城子,2019练字谣,11(1):68⁃76

69

   

 

Fig􀆰1 Theframeworkofrecommendationsystembasedonmulti⁃modalfusion

图1 多模态音乐推荐系统框架

是所有音乐的集合,每个用户对每首歌曲都存在一

个评分,用于构建“用户⁃音乐”评分矩阵并代表用户

对该歌曲的喜爱程度.传统的协同过滤推荐在构建

评分矩阵后,便直接使用该矩阵来进行相似度计算.

这里引入用户兴趣模型的概念火力全开专辑,相较评分矩阵

而言用户兴趣模型反映了用户对某些特征而不是对

某些歌曲的喜爱程度what about love,方便协同推荐时引入音乐自

身的特征.同时sabrinacarpenter,用户的兴趣会随时间发生变化,评

分矩阵无法做到实时更新,而通过建立用户即时(短

期)兴趣模型与稳定(长期)兴趣模型车巴,即可实现用

户模型的动态维护骁骑校尉,从而达到音乐推荐的客观性与

实时性.

由于用户兴趣模型可以更好地契合本文的思

想今年,故将用户兴趣模型贯穿整个推荐流程的始终佟丽娅结婚伴娘是谁,以

实现多模态的音乐推荐.

s)转化为单声道信号并进行下一步分析.

述音乐频率、节奏与音等底层的声学特征.常用的

21维的感知线性预测系数(PLP)以及9维的PLP

倒谱相关系数.本文选择MFCC参数作为声学特征.

声学特征包括20维的Mel频率倒谱系数(MFCC)、

2)声学特征提取过程.该过程主要提取一些描

时特征.对人耳而言,1kHz以下的声音频率与人的

感知能力呈线性关系,1kHz以上则呈非线性的对数

关系,而MFCC正是模拟了这种特性,将其线性频谱

映射到基于听觉感知的非线性Mel频谱中并最终转

换到倒谱上,因此能很好地反映人耳对于音频信息

的感知

[3]

MFCC提取过程包括以下步骤:

MFCC是基于模仿人耳的听觉特性所提取的短

2 音乐特征的提取与多模态融合

音乐特征提取与分析是本音乐推荐系统的基

础.特征的提取包括音频特征的提取、歌词信息的提

取以及歌词信息的降维3个部分,将得到的多个音

乐特征经多模态融合后建立音乐数据库并以此为依

据构建用户兴趣模型.

2􀆰1 音乐特征的提取与多模态融合

1)预处理过程.将所有音频文件转化为统一的

音频特征的提取过程主要分为以下2个阶段:

口,并设置预加重滤波器;

参数;

1)归一化Mel滤波器组的系数及倒谱提升窗

2)对语音信号进行分帧赵增熹,计算每帧的MFCC

3)进行快速傅里叶变换(FFT)将信号从时域转

4)求取一阶差分系数大连天空,合并MFCC参数和一阶

5)去除一阶差分参数为0的首尾两帧.

最终每一首歌曲得到5506帧

×

K维的MFCC参

换到频域上,再进行Mel滤波并计算倒谱;

差分MFCC参数;

AAC音乐格式,并从每首歌中取出20s(第50~70

数,对这5506帧的结果求均值后可得出每一首歌曲

的1

×

K维“音频⁃特征”向量.

Copyright©博看网htsReserved爱有你才完整.

70

2􀆰2 歌词信息的提取

由于歌词信息是文本的形式,为了便于计算机

的保存与处理心太软伴奏,需将歌词进行数字化转换.向量空间

模型(VSM)是由Salto等

[4]

提出的一种文本表示方

法kate micucci,该方法将歌词文档表示成高维空间中的向量剑灵服务器,每

篇文档对应一个向量,该向量中的每一维对应文档

的每一个特征项.

VSM的主要步骤包括:

GONGZhisend my love,etal.Amusicrecommendationsystembasedonmulti⁃modalfusion.

龚志,等.基于多模态的音乐推荐系统.

的噪声,即潜在语义分析(LSA),将文档从稀疏的高

维特征词空间映射到一个低维的向量空间上.LSA

采用基于数学的方式进行矩阵分解以达到降维的目

的月桂女神,故分解出的矩阵缺乏解释性.随着对LSA的深入

优化,主题模型逐渐发展起来.

所谓主题模型白雪红梅,就是通过引入一个统计模型花沙,用

来抽离出隐含在文档中的主题(Topic).假设一篇文

档可以由多个Topic混合而成汉语拼音字母歌mp,而每个Topic都是词

汇上的概率分布周言,且文章中的每个词都是由一个固

定的Topic生成的,那么可以通过:

p(从|复)

p(词语|

主题

主题)

×

p(主题|文档)

得句子中的每一个词语分开,并去除掉某些没有意

义且浪费空间的词语(停用词).比如一篇文档d经

过分词、去除停用词后还剩下n个特征词,便可建立

一个1

×

n维的“文档⁃词语”向量d

(t

火烧的寂寞简谱,t

,…gianna michaels,

)光影在线,其中,t

表示特征词,t

的值代表该特征词在本篇

歌词中出现的次数.

2)计算特征词的权重.特征词在该歌词中出现

1)预处理过程.对每一篇歌词文档进行分词,使

将一篇歌词文档的“文档⁃词语”向量映射为低维的

“文档⁃主题”向量.

1999年weeping willow,Thomas

[8]

在LSA的基础上提出了概率

潜在语义分析(pLSA),pLSA引入概率模型的方式

来表达LSA问题2019年15主题,使得每个变量以及相应的概率分

布和条件概率分布都有了明确的物理解释.pLSA的

主题概率分布是一个确定的概率分布吸血鬼骑士第一季,虽然主题本

身不确定,但主题符合的概率分布是确定的,若符合

高斯分布holycrap,那这个高斯分布的各个参数就都是确定

的楚雄彝族民歌,也正因如此迷之大陆,pLSA存在着过拟合问题.

LDA主题模型.对LDA而言,文档中每个主题出现

的概率是不确定的,在选取之前需要利用Dirichlet

先验随机参数确定出主题和词分布,再进行进一步

分析.由于LDA比pLSA更具鲁棒性country road,本文采用LDA

主题模型提取出歌词文档的主题,以达到降维的目

的.LDA主题模型的结构如图2所示

针对pLSA的缺点菊花香,Blei等

[9]

于2003年提出了

的次数能反映出音乐的情感趋势好声音李代沫,但不同的歌曲的

歌词总数不同奇思妙想喜羊羊下载,只计算特征词出现次数的方式显得

不够“公平”.为了能够反映出某特征词是否具有代

表性广场舞自由飞翔2步,本文采用词频⁃逆文档频率(TF⁃IDF)来计算

特征词的权重.

Salton等

[5]

提出了TF⁃IDF算法.该算法主要体

现了以下思想:一个词在特定的文档中出现的频率

越高,说明它在区分该文档内容属性方面的能力越

强(TF);一个词在文档中出现的范围越广李威斯,说明它

区分文档内容的属性越低(IDF)

[6]

.公式如下:

TFIDF

itonight bigbang,j

ij

×

log

其中new bird,TFIDF

i,j

表示特征词t

在文档d

中所占的权

重,N

ij

表示特征词t

出现在文档d

中的次数,N

∗j

示文档d

中所有词的个数,D表示文档总数不够成熟伴奏,D

表示

文本集中包含特征词t

的文档数.

2􀆰3 歌词信息的降维

在实际操作中莫大人萱草,由于表示音频特征的MFCC参

数只有几十维方大同 红豆 吉他谱,而一首歌的歌词中可能出现上百个

特征词(几百维),多模态融合后的特征信息一定会

偏向反映歌词信息而疏远音频特征.为了解决音频

与歌词之间的不平衡玫瑰花的葬礼歌词,还需要对歌词信息进行降维父亲节歌曲,

这里将“文档⁃词语”向量的维度降至与MFCC参数

相同的K维即可.

(SVD)、非负矩阵分解(NMF)等.1990年Deerwester

降维的方法有很多林淑蓉,传统的有奇异值分解

Fig􀆰2 LDAtopicmodel

图2 LDA主题模型

m篇文档征词n的个数,令文档隐含的主题数k

图2中你可知道我有多爱你,M表示歌词文档m的集合张恺彤个人资料,N

表示第

共有K个,α和β是Dirichlet分布先验参数是你让我看见干枯沙漠开出花一朵,这2个参

数对每篇文档都一样,用于控制每篇文档的概率分

布和条件概率分布,θ对每篇文档都一样,θ

表示第

m篇文档的主题分布,w

m生锈的吉他,n

表示第m篇文档中的第n

个特征词,z用来表征文档征词的主题分布柳畅源,z

m,n

表示第m篇文档中的第n个特征词对应的主题

[10]

[7]

提出采用奇异值分解SVD方法来过滤文档中

Copyright©博看网htsReservedamv电影下载.

学报(自然科学版),2019第105天,11(1):68⁃76

JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019the world is mine,11(1):68⁃76

71

使用LDA主题模型进行降维的过程就是求出

θ

后验分布的过程金枝欲孽,具体步骤如下:

1)θ

服从概率分布p(θ

),称为参数θ

的先验

特征空间,对于特征信息的后续处理,只需要对该多

模态特征空间进行操作即可不说话,不再需要对音频特征

与歌词信息进行训练,大幅提高了操作效率.

1)构造映射矩阵.这里构造2个K

×

2K维的矩

阵(I|0)与(0|I)你给sb织毛衣,它们都由一个K

×

K维的单位矩

阵I与一个K

×

K维的零矩阵组成;

2)映射“

音频特征”矩阵.将M首音乐的M

×

EFFC方法的具体步骤如下:

分布;z满足多项式分布z

~Mult(z

|θ

),所以选

择Dirichlet分布为先验分布牛哄哄,得到:

Dir(θ

|α)

α

, α

α

麻辣鸭头,α

,…,α

Δ(α

其中你说看星空看日落不如看我的眼眸是什么歌,Δ(α)为归一化因子Dir(α)违章动物,

Δ(α)

(1)

2)由参数θ

的先验分布Dir(θ

|α),以及各主

题出现的次数n

~Mult(n

|θ

医保卡挂失,N

),其中n

(n

(1)

老电影插曲,…一万个理由不接,n

(k)

),n

(k)

表示第m篇文档中第k个主

题产生词语的个数莲的心事席慕容,可得到θ

的后验分布为

p(θ

|z

,α)

Dir(θ

|n

α)

  

Δ(n

α

二人转东北人,

α

kk

α

dθ

维“

音频特征”矩阵A与映射矩阵(I|0)相乘蘑菇炒鱿鱼,得到

一个M

×

2K维的矩阵(A|0);

×

K维“

文档主题”矩阵B与映射矩阵(0|I)相

乘abracadabra,得到一个M

×

2K维的矩阵(0|B);

×

2K维的矩阵(0|B)平凡之路mv,即可得到包含2种音乐特

征信息的M

×

2K维“

音乐特征”矩阵(A|B).

通过上述过程,可对所有音乐构建一个包含多

模态特征的音乐数据库当我想你的时候原唱是谁,为后续建立用户兴趣模型

打下基础.

4)矩阵融合.串联M

×

2K维的矩阵(A|0)与

3)映射“文档⁃主题”矩阵.将M首音乐歌词的

(2)

则可推算出第m篇文档的主题分布为

p(z

|α)

p(z

|θ

)p(θ

|α)dθ

  

α

完成θ

后验分布p(z

|α)的求解后,即可将几百维

的“

文档词语”向量降至K维的“

文档主题”向量.

2􀆰4 多模态融合

通过音频特征的提取a time 4 you,一首歌可以表示成1

×

维的“

音频特征”向量;通过歌词信息的提取与降

维适合养老的低消费小镇,一首歌也可以表示成1

×

K维的“

文档主题”向

量.接下来就需要将音频特征与歌词信息进行多模

态融合,建立音乐数据库并以此为依据构建用户兴

趣模型.

常用的多模态融合方法主要分为特征级融合法

和决策级融合法

[11]

Δ(α

dθ

Δ(n

α)

Δ(α

3 兴趣模型的建立与用户聚类

.(3)

3􀆰1 获取用户个性化信息

个性化信息收集方式分为2种:一种是显式收集

方式,主要通过用户与系统的交互实现,用户通过系

统提供的选项直接告诉系统其对所有项目的评分;另

一种是隐式收集方式请说出来,主要通过挖掘用户的访问和浏

3􀆰1􀆰1 显式获取评分矩阵

览历史去推算出用户对各个项目的兴趣度

[12]

在用户第一次登录时杨紫曾轶可,请求用户对歌曲进行评

分(不必对所有歌曲评分,只需用户评价感兴趣的歌

曲),得到如表1所示的“

用户音乐”评分矩阵.

表1 “用户⁃音乐”评分矩阵

过将音频特征与歌词信息以串联的方式结合起来并

归一化后作为音乐的整体特征,并对整体特征进行

下一步操作.决策级融合法的主要思路是先对音频

特征与歌词信息进行分类,并赋予分类结果某种既

定规则,再以该规则作为音乐的整体特征.对本文提

出的方法,显然决策级融合法的可操作性更强,这里

选用特征级联早融合法(EFFC)作为两种特征信息

多模态融合的方法.

EFFC方法的优点是在音频特征空间与歌词信

.特征级融合法的主要思路是通

Table1 “User⁃Music”scorematrix

\10

10

 注:\表示用户未对歌曲评分.

息空间的基础上将二者映射到了一个统一的多模态

3􀆰1􀆰2 隐式用户行为分析

为了隐式收集用户对歌曲的兴趣度青春期撞上更年期下载,需建立一

Copyright©博看网htsReserved比心更痛的眼眸 郑源.

72

个兴趣函数Interest(I

),该函数反映了用户对某一

首歌曲I

的兴趣度.这里认为用户对一首歌曲的行

为包括:下载、评论、分享与收听,可相应地建立下载

函数Download(I

)、评论函数Comment(I

)、分享函

数Share(I

)、收听次数函数Times(I

)以及收听时长

函数Duration(I

轰隆隆的雷雨声,t)proudof,则有:

Interest(I

f(Download(I

),Comment(I

),

  Share(I

),Times(I

)你的名字音乐,Duration(I

,t)).

获取用户对歌曲兴趣度的过程如下所示:

GONGZhilovemaker,etal.Amusicrecommendationsystembasedonmulti⁃modalfusion.

龚志bottomless,等.基于多模态的音乐推荐系统.

综上,通过用户行为分析得到用户对某一首歌

曲的兴趣度:

Interest(I

Times(I

3􀆰2 建立用户兴趣模型

3􀆰2􀆰1 即时兴趣模型

通过第2章的特征提取,得到了多模态特征信

息的M

×

2K维“

音乐特征”矩阵(A|B),对于第i

首歌而言我真的受伤了钢琴谱,1

×

2K维“

音乐特征”向量可以表示为

{(f

,w

i,1

),(f

,w

i,2

),…life s a struggle,(f

40

薛平贵与王宝钏下载,w

i等不来,40

)}北京青年主题曲,

perInterest(I

,n).

户对歌曲I

的兴趣度为

perInterest(I

,n)

f(Download(I

)经典英文歌曲推荐,

n进行叠加即可得到Interest(I

).

1)收听次数函数Times(I

).针对一次收听第三回合,用

  Comment(I

)贝瓦网,Share(I

),Duration(I

哥抽的不是烟是寂寞,t))钢琴轻音乐,

其中别 薛之谦,f

表示第j个特征爱已离去,w

i,j

表示第i首歌中第j个特

征的权值.此时结合3􀆰1节中给出的用户对某一首歌

曲的兴趣度Interest(I

),可计算出用户对歌曲I

即时兴趣:

ö

×

i难念的经 周华健,1

÷

è

max[Interest(I

)]

ø

Interest(I

æö

  

ç

×

i别看我只是只羊,2

÷

,…

è

max[Interest(I

)]

ø

max[Interest(I

)]表示在音乐数据库全部的M首歌

ç

最新抗日剧,

只需将单次兴趣度perInterest(I

多爱你一天歌词,n)根据收听次数

Comment(I

)、分享函数Share(I

).只要下载、评论、

分享这3个行为中有任何一个发生就代表用户对这

首歌有最高兴趣度(兴趣度为1)八字合婚软件,故3个函数的计入

原则为:若用户首先下载了歌曲I

,则perInterest(I

乌兰托娅,

n)

Download(I

1,无论评论、分享行为是否发

生,都不计入这2个行为产生的兴趣度,同时收听时

长函数Duration(I

,t)也不计入perInterest(I

易水送别,n);

同理若用户首先分享了歌曲I

,那么perInterest(I

n)

Share(I

1好听的法语歌,其他行为也不再计入;以此类推.

下载、评论、分享中任何一个行为发生时,

Duration(I

离婚吧 殿下,t)不计入兴趣度李小白,而这3个行为均未发

生时,则有perInterest(I

琵琶语 林海,n)

Duration(I

,t).这里给

出2个临界时间参数:t

与t

.若用户的收听时长t<

时偏偏喜欢你未删减版,表示用户可能不喜欢这首歌就快速进行切歌

状态,perInterest(I

,n)

Duration(I

走出沙漠的刀郎,t)

0;若收听

时长t>t

时,表示用户可能已离开播放器或者忘记

关闭音乐,perInterest(I

城市猎人片尾曲女声,n)

Duration(I

,t)

0;若

收听时长t∈(t

拥抱吉他谱txt,t

)那年夏天的秘密,则Duration(I

,t)符合线性函

数,有Duration(I

,t)

kt

b(k>0七夕歌词,b<0)汇博人才,且仍满

足最高兴趣度max[perInterest(I

吴姵文,n)]

1的条件.此

时,可以将单次兴趣度函数归纳为

perInterest(I

,n)

f(Download(I

),Comment(I

)上元,

Share(I

)挂念歌词,Duration(I

马千珊,t))

[1

Action(I

)]

×

Duration(I

,t)

Action(I

)拔萝卜舞蹈,

3)收听时长函数Duration(I

,t).上文介绍了当

2)下载函数Download(I

)、评论函数

{

æ

Interest(I

}

中,用户对歌曲I

的兴趣度最大童话手机钢琴谱,故用作分母以进行

归一化.

通过上述分析,可得出用户对M首歌的即时兴

趣模型为

其中on on,

sss

{(f

与小三pk的日子,W

)hideandseek,(f

,W

)哆来咪发,…最好听的古典音乐,(f

40

第三十六个故事,W

40

)}蝴蝶城,

3􀆰2􀆰2 稳定兴趣模型与LSTM神经网络

é

Interest(I

ù

ú

.W

ê

×

m,i

êú

ë

max[Interest(I

)]

û

当用户的即时兴趣模型建立后刘德华经典粤语歌曲,可以充分代表

用户在一段时间内对不同音乐特征的兴趣度,但随

着用户不断地收听新的音乐或是很长一段时间不听

某种音乐双双,其喜好程度也会随之改变,故即时兴趣模

型无法反映出用户兴趣度的变化趋势.

长短时记忆模型(LSTM)于1997年由Sepp

[13]

提出东北人歌词,它可以模拟出人类的记忆曲线,实现新

信息的输入、旧信息的遗忘以及最终信息的输出等

功能.本文采用LSTM神经网络西藏秘密片尾曲,将用户的即时兴趣

模型作为输入,通过神经网络内部各节点的计算,输

出用户的稳定兴趣模型.

图3是一个基本的LSTM神经网络模型万能空调机遥控器,并结

合本文要求进行了相应的修改.LSTM有3种特殊的

门结构,分别是输入门、输出门与遗忘门,是LSTM

实现记忆与遗忘的关键.

其中,当下载、评论、分享中任何一个行为发生时,

Action(I

1最美丽的第七天,若3个行为均未发生时,Action(I

0.

Copyright©博看网htsReserved好声音冠军预测.

学报(自然科学版)jfkj,2019,11(1):68⁃76

JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019,11(1):68⁃76

73

Table2 "User⁃Feature"real⁃timeinterestmodel

1,1

2,1

j,1

A,1

1,2

2,2

j,2

Aromantic fantasy,2

1,p

2,p

j,p

A,p

表2 “用户⁃特征”实时兴趣模型

1冲灵剑法,

2,K

j全面通缉,K

A,

Fig􀆰3 ThestructureofLSTMnetwork

图3 LSTM神经网络的结构

通过上述过程,可对所有用户构建一个实时兴

趣模型神思者,为后续用户聚类和个性化推荐打下基础.

3􀆰3 用户聚类

3􀆰1􀆰1节中通过显式方式获取了“

用户评分”矩

阵.由于用户并非对所有歌曲都进行评分,使得该矩

阵的稀疏性很大纯名里沙,此时可通过用户聚类将目标用户

与其邻居放入同个用户组内新虎口遐想,令“

用户评分”矩阵转

变为“

邻居评分”矩阵,在某种程度上降低矩阵的稀

疏性.

常用的聚类方法有k⁃means算法,它采用距离

作为判断相似性的标准,即认为2个对象的距离越

近,其相似度就越大.该算法存在一些缺点:若选取

的初始聚类中心点不当,就会对聚类结果产生较大

的影响.这里使用一种改进算法———基于二分的聚

类算法(bi⁃section)来进行用户聚类.

1)初始情况下,将所有用户作为一个簇电影一颗红豆,然后随

二分聚类算法的过程如下:

作为输入香山射鼓,在神经网络内部进行相应计算后通过输

出门将当前状态进行输出.

2)第2次训练时,以第1次训练的输出状态作

1)LSTM第1次训练时,以用户的即时兴趣模型

LSTM训练稳定兴趣模型的步骤如下:

为输入,在输入门中进行处理,同时将用户对各个特

征的权值(兴趣度)W送入遗忘门,由遗忘门根据该

特征当前的权值判断其是否应该被遗忘.若被遗忘

则将该特征的权值置零;若未被遗忘则通过输出门

将当前状态进行保存输出.

3)接下来的训练同理,通过输出门保存上一次

训练的状态并作为当前训练的输入.若用户收听了

新的歌曲画个圈圈诅咒你,则需要通过输入门更新对应特征的权值,

再重新进行训练.

4)选用梯度最速下降法来限定LSTM训练的迭

代次数.在迭代过程中super junior sorry sorry,一旦损失值(loss)收敛到1

户的稳定兴趣模型:

机选取2个初始聚类中心点(seed),使用余弦相似

度依照用户实时兴趣模型计算用户之间的相似度

cos(U

i,

)胡夏 那些年,并以此将该类分为2个簇;

簇中随机选出2个seed,同样将该簇中的用户分配

到2个子簇中;

3)此时产生了3个簇爱情公寓2插曲,但这3个簇并非最优nba说唱,需

2)从2个簇中选择用户数量较多的簇never say goodbye mp,再从该

以下就可终止训练过程.此时输出门的结果就是用

lll

{(f

右手戒指,W

),(f

东南劲爆音乐榜颁奖典礼,W

)愁啊愁,…情同手足歌词,(f

40

lehecai,W

40

)}.

3􀆰2􀆰3 实时兴趣模型

在3􀆰2􀆰1节与3􀆰2􀆰2节中已分别得到了用户的

即时兴趣模型与稳定兴趣模型,这里还需结合这2

种兴趣模型来构建用户的实时兴趣模型.一般采用

加权平均的方法来计算某个特征在实时兴趣模型中

的权重那么问题就来了,对于特征f

,其权重W

可以表示为

α

×

β

×

爱在旅途片尾曲,

要进行调整岳军影,即将任意一个簇中的任意一个用户移

动到其他簇中心愿伴奏,若结果变优铁窗泪歌谱,则执行本次操作大闹天竺下载,否则

不执行.

1)簇内优化:所有簇的内部平均相似度l达到

2)簇间优化:该簇与所有簇之间的相似度期望

故可建立一个优化函数fun(),使得:

æ

minE

ö

÷

fun()

min

ç

è

max

ø

判断结果是否变优包括:

其中伍佰的爱你一万年,W为即时兴趣模型征f

所对应的权值,W

为稳定兴趣模型中该特征所对应的权值,α

β

1非诚勿扰 夏燕,

∈(0shuba,1].由于即时兴趣更能体现用户当下的兴

趣爱好,再经过多次实验后选定α

0􀆰6,β

0􀆰4.

第j个用户对第p个特征的实时兴趣度.

用户实时兴趣模型如表2所示.其中,W

j,p

表示

最大;

值E最小.

Copyright©博看网htsReservedscandal乐队.

74

邻居用户U

、U

和U

占有欲,通过邻居用户的评分即可进

行个性化推荐.聚类后的“

邻居特征”实时兴趣模型

如表3所示迪厅美女,“

邻居评分”矩阵如表4所示.

表3 聚类后的“邻居⁃特征”实时兴趣模型

Table3 Clustered"Neighbor⁃Character"real⁃timeinterestmodel

1,1

2,1

5,1

j,1

1,2

2,2

5,2

j,2

1,p

2,p

5,p

j,p

1,

2,K

5雪饮狂刀,K

j,

GONGZhi,etal.Amusicrecommendationsystembasedonmulti⁃modalfusion.

龚志与你同飞,等.基于多模态的音乐推荐系统.

以用户j为例沉默的糕羊,通过用户聚类后得到了用户j的

居用户的余弦相似度:cos(U

,U

)、cos(U

,U

)与

cos(U

你到底爱谁简谱,U

)微博控 许嵩,分别简记为c

、c

与c

2)计算U

所有已评分歌曲的平均分r

􀭰

3)针对某一首U

未评分的歌曲q最好不相见 仓央嘉措,由邻居用户

×

(9

􀭰

×

(10

􀭰

×

(7

􀭰

1)3􀆰3节的二分聚类过程中导火线下载,已得到U

与其邻

分别对歌曲q的评分9、10、7来预测U

对该歌曲的评

分r

j回忆里的疯狂,q

j蹦迪音乐,q

􀭰

表4 聚类后的“邻居⁃评分”矩阵

Table4 Clustered"Neighbor⁃Score"matrix

10

歌曲的得分loveyoulikealovesong,并降序排列不再为你流泪,如:{(I

海洋咖啡馆第8辑,10)heartsdales,(I

akimbo,9),

(I

,9),…}生日歌钢琴谱,并将得分最高的前N首未评分歌曲推

荐给用户.

40位用户的评分作为输入给你一朵小红花,输出个性化推荐的3首

歌曲如图4所示

将数据集中的500首音乐、500篇歌词文档以及

4)采用Top⁃N推荐方法雪花的快乐,罗列出U

所有未评分

同理窗外有蓝天,可计算出U

所有未评分歌曲的得分.

10

10

 注:\表示用户未对歌曲评分.

4 实验及结果

4􀆰1 实验数据集

用于实验的数据集中武汉欢乐谷年卡,音频文件为AAC格式刘艺涵,

截取时长为20s且已转化成单声道信号的500首英

文歌曲saku,这些音频文件为iTunes美区商店售卖的正

版音源,基本涵盖了Pop、EDM、Classical、Country、

Rock、R&B以及Hip⁃Hop等各种流派的音乐.为了保

证截取的音乐片段具有代表性真心,经多人讨论后选择

出一首歌最具代表性的第50~70s.歌词文件为txt

格式lost my pieces,且与音频文件一一对应ktv点歌,用户总数为40人,其

中1人为目标用户.通过问卷调查的方式收集这40

人对500首歌中任意100首歌曲的评分.

4􀆰2 结果分析

4􀆰2􀆰1 个性化推荐结果

Fig􀆰4 Theresultofpersonalizedrecommendation

图4 个性化推荐结果

4􀆰2􀆰2 验证结果的准确性

除了验证系统的有效性之外命运不是辘轳,还需进行对比实

验以验证实验结果的准确性.这里给出3种对比环

境la la love on my mind,这3种环境也能充分代表目前常见的几种音乐

推荐系统:

1)环境1:本系统谈莉娜图片,即基于音频特征与歌词信息

2)环境2:只基于音频特征的单模态音乐推荐

3)环境3:不采用任何音乐内容特征,传统的协

选用误差平方和(SSE)作为结果准确性的判断

标准.SSE计算的是拟合数据和原始数据对应点的误

差的平方和,SSE越接近于0,说明模型选择和拟合

更好阿军,数据预测也越成功.

选取40位用户中任意1位作为目标用户打工行伴奏,将该

用户的“

用户评分”向量中部分真实评分删除,并分

别在3种不同对比环境下预测该用户的得分,计算

被删除的真实评分与预测得分之间的SSE断点张敬轩,结果如

图5所示.

的多模态音乐推荐系统;

系统;

同过滤推荐系统.

上文已完成了基于多模态的音乐推荐系统的前

期工作,包括由音乐的多模态特征建立了用户的兴

趣模型stay gold,又由兴趣模型到了目标用户的邻居.这里

同样指定U

为目标用户.首先选定音频特征与歌词

文档主题的维数K

20,接下来根据其邻居用户U

和U

来预测U

对未评分资源的得分,从而进行个

性化推荐.

个性化推荐的步骤如下:

Copyright©博看网htsReserved.

学报(自然科学版)同伊电视剧全集观看国语版免费版,2019,11(1):68⁃76

JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition)你是我的小提莫,2019,11(1):68⁃76

75

从图6中可以看出虚线代表的多模态推荐系统

下的预测得分与真实评分最为拟合让青春继续第二部,单模态系统次

之,传统协同过滤效果最差;从图7可以看出多模态

Fig􀆰5 SSEbetweenpredictedscoreandrealscore

图5 预测得分与真实评分的差异SSE

推荐系统下的预测得分偏差最小老地方的雨,也最接近0.

综上所述没人懂,基于音频特征与歌词信息的多模态

音乐推荐系统无论从有效性方面还是从准确性方面

来说,都要比目前常见的几种音乐推荐系统效果

更好.

通过图5可以证实多模态音乐推荐系统与真实

数据的拟合度最高御剑江湖 歌词,其次是单模态系统,而传统的协

同过滤拟合度最低文明在哪里歌曲,这一结论也充分验证了多模态

音乐推荐系统准确性较高.

图6为不同环境下用户的真实评分与预测得分

曲线.为使折线图更加直观易读如果有那么一天,这里随机挑选500

首歌中的15首来作图

5 结论与未来工作展望

文中描述了一个将音乐的音频特征和歌词信息

经过多模态融合的音乐推荐系统女人洗澡不关门,应用LDA模型来

处理歌词信息.对于多模态融合方法的问题爱你够不够 孙楠,使用了

EFFC融合方法男人也没办法,并建立了多模态音乐数据库.将用

户兴趣模型通过LSTM神经网络进一步得到用户的

实时兴趣模型漫之大陆,以此作为用户聚类的基础.在与传统

协同过滤推荐方法相对比后发现对猪弹琴,该方法的准确率

确有一定程度的提高,并在最后充分验证了该方法

的有效性和准确性.今后kim sang woo,将把研究重点放在如何把

用户的情感信息作为推荐系统的另一极,根据用户

的情感进一步筛选个性化推荐的结果.

参考文献

图6 不同环境下用户的真实评分与预测得分

Fig􀆰6 Realscoreandpredictedscore

underdifferentenvironments

References

图7则分别计算了3种环境下,真实评分与预

测得分的偏差

图7 不同环境下预测得分与真实评分的偏差

Fig􀆰7 Differencesbetweenpredictedscoreand

realscoreunderdifferentenvironments

[1] 曾子明.信息推荐系统[M].北京:科学出版社缠绵游戏陈奕迅,2015:

65⁃66

ZENGZiming.Informationrecommendationsystem[M].

Beijing:ChinaSciencePublishing&MediaLtd,2015:

65⁃66

[2] 唐沁钦.多媒体系统中个性化推荐的研究和设计[D].

北京:北京交通大学,2011

TANGQinqin.Designofpersonalizedinformationdelivery

inmultimediasystem[D].Beijing:BeijingJiaotongUni⁃

versitydaredevil,2011

[3] 薛昊.基于多模态融合的音乐情感分类方法[D].南

京:南京大学,2016

XUEHao.Theresearchonmusicmoodclassification

methodsbasedonmulti⁃modalfusion[D].Nanjing:

NanjingUniversity,2016

[4] SaltonG,WongA,YangCS.Avectorspacemodelfor

automaticindexing[J].CommunicationsoftheACM,

1975彩虹天堂伴奏,18(11):613⁃620

[5] SaltonG阳城之窗,YuCT.Ontheconstructionofeffectivevocabu⁃

lariesforinformationretrieval[C]∥Proceedingsofthe

1973MeetingonProgrammingLanguagesand

InformationRetrieval.NewYork:ACM,1973:11

[6] 施聪莺,徐朝军,杨晓江.TFIDF算法研究综述[J].计

算机应用,2009我是愤怒,29(b06):167⁃170

SHICongying,XUChaojun罗永娟,YANGXiaojiang.Studyof

TFIDFalgorithm[J].JournalofComputerApplications梅花三弄歌曲,

Copyright©博看网htsReserved颜小朵.

76

[7] 

[8] 

2009民族乐器图片,29(b06):167⁃170

DeerwesterS,DumaisST孤独等待黎明,FurnasGW,etal.Indexingby

latentsemanticanalysis[J].JournaloftheAmericanSo⁃

cietyForInformationScience童谣歌词,1990,41:391⁃407

ThomasH.Probabilisticlatentsemanticindexing[C]∥

ProceedingsoftheTwenty⁃SecondAnnualInternational

SIGIRConferenceonResearchandDevelopmentinIn⁃

formationRetrieval(SIGIR⁃99)朱永飞,1999

BleiDM,NgAY释放灵魂,JordanMI.Latentdirichletallocation

[J].JournalofMachineLearningResearch,2003白小曼,3(4/

5):993⁃1022

MorrisC.Parametricempiricalbayesinference:theory

GONGZhi我是歌手杨宗纬最爱,etal.Amusicrecommendationsystembasedonmulti⁃modalfusion.

龚志,等.基于多模态的音乐推荐系统.

[9] 

[10] 

andapplications[J].JournaloftheAmericanStatistical

Association,1983谐音,78(381):47⁃65

[11] ZengZ菩提树下下载,HuY,LiuM,etal.Trainingcombinationstrategy

ofmulti⁃streamfusedhiddenmarkovmodelforaudio⁃vis⁃

ualaffectrecognition[C]∥Processof14thACMInter⁃

nationalconferenceofmultimedia,2006:65⁃68

[12] NicholsDM.Implicitratingandfiltering[C]∥

ProceedingsoftheFifthDELOSWorkshoponFiltering

andCollaborativeFiltering偶像先生,1997

[13] HochreiterS何蓝逗情商,SchmidhuberJ.Longshort⁃termmemory

[J].NeuralComputation,1997,9(8):1735⁃1780

Amusicrecommendationsystembasedonmulti⁃modalfusion

1CollegeofTelecommunicationsandInformationEngineering,NanjingUniversityofPostsandTelecommunications,Nanjing 210003

GONGZhi

 SHAOXi

Abstract Despitethecontinuousenrichmentofmusic喜多郎,theunderlyingmusicfeaturesareoftenoverlookedwhen

usingtraditionalcollaborativefiltering.Bymulti⁃modalfusionofaudiofeaturesandlyricinformationandsupplemen⁃

tingthefusioninformationfeatureasacollaborativefilteringrecommendation马云谈区块链,amulti⁃modalmusicrecommendation

systemisproposed.Thisstudyprimarilydiscussestheextractionofaudiofeaturesandlyricsinformationandusesthe

thisstudyproposesanEFFCfusionmethod,andcomparestheresultsofmulti⁃modalfusionwiththeresultsusing

musicrecommendationsystemreducestheSSEoftheresultfrom2􀆰009to0􀆰3886,verifyingtheeffectivenessofthe

method.

Keywords musicrecommendation;collaborativefiltering;LDAtopicmodel;multi⁃modalfusion;LSTMnetworks

LDAtopicmodeltoreducethecharacterdimensionofthelyricsinformation.Forthemulti⁃modelfusionproblem,

single⁃mode.Forresultrecommendationspiggy,theuserinterestmodelisestablishedbasedonthemulti⁃modalinformation

featurewiththeinputofLSTMnetworkstofilterandoptimizetheusergroup.Theresultsshowthatthemulti⁃modal

Copyright©博看网htsReserved.

派派后花园-psp山脊赛车金手指

基于多模态的音乐推荐系统

留言与评论(共有 12 条评论)
本站网友 运城妇科医院
10分钟前 发表
则Duration(Ii
本站网友 睡眠呼吸暂停
29分钟前 发表
这里选用特征级联早融合法(EFFC)作为两种特征信息多模态融合的方法.EFFC方法的优点是在音频特征空间与歌词信U1U2Uj︙︙.特征级融合法的主要思路是通Table1 “User⁃Music”scorematrixI28\……………Iq9……………IM78\\10︙︙\7︙︙\910\\︙︙︙︙UA 注:\表示用户未对歌曲评分.息空间的基础上将二者映射到了一个统一的多模态3􀆰1􀆰2 隐式用户行为分析为了隐式收集用户对歌曲的兴趣度青春期撞上更年期下载
本站网友 李厚霖
6分钟前 发表
α+β=1非诚勿扰 夏燕
本站网友 炼钢工艺流程
24分钟前 发表
这2个参数对每篇文档都一样
本站网友 yiji
12分钟前 发表
博士
本站网友 集美房屋出租
27分钟前 发表
ti的值代表该特征词在本篇歌词中出现的次数.2)计算特征词的权重.特征词在该歌词中出现1)预处理过程.对每一篇歌词文档进行分词
本站网友 桂林农家乐
28分钟前 发表
则需要通过输入门更新对应特征的权值
本站网友 阴经图
4分钟前 发表
用户通过系统提供的选项直接告诉系统其对所有项目的评分;另一种是隐式收集方式请说出来
本站网友 中山国际人才
29分钟前 发表
得到如表1所示的“用户音乐”评分矩阵.表1 “用户⁃音乐”评分矩阵I1\过将音频特征与歌词信息以串联的方式结合起来并归一化后作为音乐的整体特征
本站网友 过期已备案域名
15分钟前 发表
由遗忘门根据该特征当前的权值判断其是否应该被遗忘.若被遗忘则将该特征的权值置零;若未被遗忘则通过输出门将当前状态进行保存输出.3)接下来的训练同理
本站网友 广东火电吧
1分钟前 发表
IM}Copyright©博看网htsReserved闭嘴花美男乐队1.学报(自然科学版)