按关键词阅读: 分析 系统 语音 影响 基于 性能 识别 场景 噪音
1、基于语音识别系统性能影响的噪音场景分析摘要:噪音场景分析对提高语音识别系统在复杂环境下的鲁棒性具有重要的意义 。
本文介绍了一种基于语音识别系统性能影响的噪音场景聚类分析方法 , 是采用数理统计学方法分析噪音场景对于语音识别系统性能的影响效应 , 依据效应分析来实现对噪音场景的聚类 。
基于方差分析法的统计模型能够将噪音场景对性能的影响效应分解为训练、测试的单独效应以及二者的交互效应这三个部分并准确地估计这三种效应 , 进而实现对噪音场景的聚类 。
最后通过识别实验对聚类合理性进行验证 。
关键字:语音识别;方差分析;析因设计;噪音聚类 。
Analysis of Background Noise based on perf 。
2、ormance influence for Speech Recognition SystemAbstract: Noise scenes analysis technique plays a very important role for improving the adaptation of Speech Recognition System in Noise Background. A new clustering analysis method based on performance influence for Speech Recognition System has been i 。
3、ntroduced. By means of statistical analysis methods, it analysis the influence of scene noises on system performance and get the similarity for clustering. A statistical model based on ANOVA was proposed to decompose the effect on system performance into three parts: effect of training data, test da 。
4、ta and their interaction, and each path is considered dependent on scene noises. Finally verify reasonableness of clustering by means of Speech Recognition experiments.Keywords: Speech Recognition;
ANOVA;
Factorial design;
Noise Clustering.1 引言目前关于提高语音识别系统在真实环境下的鲁棒性问题已经成为了语音识别技术的研究热点123 。
目前的语音识别系统只能在 。
5、一定的限制条件下获得满意的性能 , 或者说只能应用于某些特定的场合 。
影响语音识别系统在复杂环境下性能的主要*基金项目:国家“863”计划基金资助项目(2004AA114010)原因有两个:一是背景噪音影响了语音信号的质量;二是训练数据与识别环境不匹配 。
针对影响系统性能的这两个主要原因 , 研究者们采取的主要措施一个是研究抗噪算法 , 另一个就是进行加噪训练 。
研究抗噪算法是为了消除背景噪音对话音的影响 , 提高语音信号的质量 。
加噪训练是为了使训练数据和识别环境更加匹配 。
由于真实环境里噪音的种类繁多 , 对每一种噪音都去研究抗噪算法或者用每一种噪音来进行加噪训练都是不合适的 。
因此我们有必要把各种噪音场景聚成有限的几类 。
6、 , 用这几个大类中的典型噪音去代表所有的噪音 , 从而可以更有针对性地研究抗噪算法 , 同时也可以更方便地进行加噪训练 。
所以对噪音场景的分析对于语音识别来说是非常有意义的 。
通常的音频场景分析大都是采用基于声学特征的分析 , 需要先对音频进行声学特征的提取 , 将从不同场景中提取的音频信号特征作为研究对象 , 通过不同的方法进行音频场景分析 。
提取的特征通常有短时过零率和能量特征 , 频域和倒谱域的特征45 , 以及线性谱频率LSF6等等一些其他特征 。
目前用的最广泛的特征是梅尔倒谱系数MFCC 。
本文提出了一种新颖的噪音场景聚类分析方法 。
区别于其他传统的聚类方法78 , 它没有声学特征的提取 , 而是采用是数理统计学方法分析噪音场景对于 。
7、语音识别系统性能的影响效应 , 依据效应分析来实现对噪音场景的聚类 。
该方法对比于其他基于声学特征的聚类方法 , 是完全从系统性能角度出发 , 要将复杂繁多的噪音场景归纳为几个典型大类 , 使得类内场景对系统性能影响不显著 , 类间场景对系统性能影响显著 。
而基于声学特征的聚类有可能不能完全反映噪音场景对系统性能的影响 , 因为可能存在声学特征类似的噪音对系统性能影响显著 , 而声学特征不同的噪音却对系统性能影响不显著 。
具体步骤为:1.首先进行语音识别实验 , 利用HTK工具搭建的大词汇连续语音识别系统LVCSR和国家863基础语音库完成加噪训练并测试 , 得到分析数据;2.然后利用统计学方法和试验优化方法分析实验结果 , 研究各种噪音 。
8、场景对语音识别系统性能的影响效应;3.最后根据效应分析结果对噪音场景数据进行聚类分析 。
该方法的总体流程图如图1所示 。
另外需要说明的是 , 本文用的语音识别系统是由剑桥大学开发的HTK工具搭建的 。
HTK是基于HMM的语音识别工具 , 是目前比较通用和公认的一个工具 , 大多数的语音识别系统都是在它基础上搭建的 。
稿源:(未知)
【傻大方】网址:/a/2021/0813/0023654548.html
标题:基于|基于语音识别系统性能影响的噪音场景分析