基于幅度差及相位差融合的多通道声源分离技术研究(3)

（3）使用线性麦克风阵列在室内实际测量采集语音混合信号，并对采集来的数据进行预处理，在Cool edit pro观察波形分析以及使用MATLAB进行仿真。
（4）研究了一种结合幅度差与相位差融合的多通道声源分离方法，根据实际测量数据进行仿真分析，并进行评价。
1.4 本文的主要内容与结构
本文的任务在于针对基于相位差和幅度差的盲源分离技术的改善，根据二者在不同条件下的表现，探究了融合幅度差和相位差的声源分离技术，这是一种可以在更普遍的、非理想设置环境中结合IPD和ILD特性最大化的分离方法。。我们使用多通道线性麦克风阵列在室内实测采集混合语音信号数据，然后用cool edit pro 软件对观察信号，用matlab软件对声源分离进行仿真并得对仿真结果进行合理的解读。
本文的结构内容如下：
第一章绪论。首先针对麦克风阵列进行简单的介绍并强调其在语音的现代处理技术中的重要性。其次介绍了多通道声源分离技术的来源，进一步阐释其应用价值及市场前景，然后对国内外的发展前景做了一定的归纳与总结。
第二章原理概述。主要针对总结一些使用到的基本知识，包括声音信号模型、阵列信号特征、聚类算法、声源分离原理等。
第三章数据采集方案。主要阐述了实测户外多声源混合信号的采集、分析与处理方法与过程，包括采集设备、过程、处理加工数据、时频波形等。
第四章仿真结果。使用MATLAB软件对不同频道间声音信号进行处理的得到的仿真结果，包括信号失真比、信号干扰比、信号样本比等。
第五章结论。根据仿真结果对基于幅度差和基于相位差的源分离处理技术进行比较其在不同频率段以及不同麦克风阵列下的表现。
2 麦克风阵列分析原理
2.1 语音信号模型
2.1.1语音信号分析
声波的产生是由声源体发出声音时，其自身的震动引起了其周围空气产生震动，产生相应的振荡方式，就形成了人们耳中听到的声音。只要有传播介质的地方，声波会依靠介质到处向四周传播。声波在空气中传播的的过程就是空气中的空气因子在做上下的谐振运动，并且将这种运动向相邻的因子传递下去，这样就解释了为什么声波在向着远处前进，而空气因子不会出现大范围的运动只是小幅度的震动。还有就是，即使周遭环境中没有发出声波的声源，空气中的因子自身也会不停地无规律的震动，这种震动会激起极其微弱、人们无法察觉的白噪声[2]，与之相类似的，电声仪器的内部也会存在一定程度的白噪声。除了我们常见的传播介质空气之外，很多例如水和金属等也都是可以作为声音传播时的良好介质，然而声波不能在真空状态下传播。众所周知，声速除了与传播媒介自身的种类有关，也会受诸如温度等的影响。在同种介质中，不同的环境温度也决定了传播速度的不同，速度伴随着温度的提升而加快。它和温度的关系可以用以下公式来表示：
(2-1)
如果介质中相应的温度差异不大，那么声速也不会有什么差异，基本不变。一般情况下，在 15℃时声音传播的速度为 340m/s是我们通常采用的数值。至于一段声波可以传递多远，大气的吸收性是其距离的首要因素，其次是包括温度、湿度和气压等都会造成影响。
2.1.2 语音信号的短时平稳特性
从整体上来看，因为语音信号是随着人说话的过程是不断变化的，所以信号的体现语音本身的特征也是在不断变化着的。对其进行分析处理的时候，因为这种变化导致是提到的分离算法无法实现，因为这种技术本身仅用于处理平稳信号。人说话过程中发声机理是由口腔肌肉运动来产生语音的。也就是说，当我们不断变换发音时声道的形状是不断变化的。但是，这种变化相对于语音频率以Khz为计算单位来说来说，发声时口腔肌肉的变换的频率是比较低的，这就意着，虽然语音信号具有随着时间变化而变化的时变特性，但是在一个较短时间范围，这种变化可以忽略不计，因而可以将这个较短时间范围内的语音变化作为接近稳态过程，所以标题中提到短时平稳性我们视其为语音信号的特征 [5]。所以，本文中我们想要分析语音信号的特征并进行处理时，就必须将采集到的信号分帧计算，实验中一般取帧长度为30ms 以内。基于幅度差及相位差融合的多通道声源分离技术研究(3):http://www.751com.cn/tongxin/lunwen_19815.html