一种基于N-modeSVDHRTF个人化近似方法

一种基于N-modeSVDHRTF个人化近似方法摘要:本文提出了一种基于N-modeSVD的HRTF个人化近似方法。HRTF(Head-RelatedTransferFunction),即头相关传输函数,描述了声波从声源方位到耳道口的传输特性,反映了头部、躯干和外耳等身体结构对不同方向声音信号的滤波效果。本文给出的多重近似方法基于传统独立主元分析的张量扩展[1]。使用该方法只需测量不同个体的部分生理参数即可得到该个体的个人化HRTFo关键词:听觉系统;HRTF;张量;多重线性近似:TP311头相关传输函数HRTF(Head-RelatedTransferFunc-tion)描述了声波从声源到耳道口的传输特性,反映不同个体的身体结构对不同方向声音信号的滤波效果,是头相关脉冲响应HRIR的傅里叶变换,它能解释传统的耳间差线索(双耳时间差和双耳强度差)的声源定位机理,同时还能解释传统双工理论所不能解释的“混淆锥”问题[2]。HRTF与特定的声源方位及特定个体的生理结构(头部、躯体、外耳等结构)有关,如果采用不匹配的HRTF的虚拟听觉系统,听者由于其本身的HRTF与系统采用的HRTF差异,容易造成听者的声源定位失真[3]。然而HRTF的测量是一项耗时且昂贵的工作,对每个个体进行全方位的HRTF测量也不---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---切实际。因此,从应用的角度考虑,需要寻求个人化HRTF的近似方法,即通过对受试者的一些结构参数及生理尺寸的测量,或者通过测量空间少数方向的HRTF数据,通过近似的方法估计和定制出相应的个人化HRTFo1HRTF的张量分解1.1张量的基本概念通常情况下张量[5-7]可以看作为矩阵的扩展,一个向量可以看成是一阶张量,一个矩阵可以看成二阶张量,有若干个相同维数矩阵叠放在一起组成立方体形式的数组可以看作为一个三阶张量。更高阶的张量无法使用可视化直接表示。灰度图像本质上是一个矩阵[4,5],视频则是一个三阶张量。一般情况下,基于向量的算法要把矩阵或者其它阶张量展开为向量,容易破坏原始数据的空间结构。而基于张量的算法不需要将张量展开为向量。下面是一些髙阶张量运算定义[6]。设X为M阶张量,即,其中Ni表示X每阶的维数。X的某个元素定义为:,其中1WniWNi,lWiWM。张量积:设X和Y张量同阶,即,则X和Y的张量积定义为:(1)张量模d矩阵化:模d矩阵化是指将一个M阶张量转换为一个矩阵。即将张量X转换为,。张量模d矩阵化的实质就是把张量X的第Nd阶方向的向量提出来,而其它阶方向的向量---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---置于Nd阶方向的向量的后面形成一个矩阵。张量压缩:张量压缩通过让两个下标相等并把所有重复下标的值相加得到。张量压缩可以使张量阶数减2,同时满足爱因斯坦求和约定。通常情况下,,,张量积的压缩定义为:(2)张量的模d乘:张量的模d乘是张量和矩阵的一种运算,表示为XXdUo1.2基于N-modeSVD的HRTF分解N-modeSVD分解最主要的一个功能是对于目标维度的降维。传统的PCA降维会影响整个数据的结构,而N-modeSVD降维可以分别对特定维度进行。SVD(singularvaluedecomposition)作为传统主元分析法的拓展,D二U1SU2T,假设D为mXn矩阵,那么U1为mXm阶酉矩阵;S为mXn阶对角矩阵,其中Sii为D的奇异值;U2T为nXn阶酉矩阵。使用张量的模d乘可得D二SX1U1X2U2,对于通用的N-modeSVD可以表示为:D=zXlUlX2U2XLXnUnXNUN式中核张量z类似于SVD分解中奇异值张量,Ui表示张量的特征向量。详细的N-modeSVD分解请参考文献[1]。2HRTF多重线性近似2.1HRTF数据本文采用加州大学戴维斯分校提供的CIPIC数据库[8],---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---它提供了43个真人对象的1250个方位(50个垂直方向,25个水平方向)的HRIR数据。其空间分辨率约5°。另外CIPCI数据库还给出了27个人体参数的测量数据。每个HRIR时长4.5ms共200个采样点,经过FFT变换得到HRTF,这里我们左右耳组合成一个包含左右耳HRTF共400个频率点。CIPIC数据库中的43个真人受试者其中有8个人的数据不可获取,故37个受试者的数据可用。对于该37个对象的人体参数经过DTF的PCA分析选择8个人体参数。最后得出一个人体参...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?