按关键词阅读: 分析 系统 语音 影响 基于 性能 识别 场景 噪音
所以利用由它搭建而来的这个基线系统进行我们的研究是比较有代表性和通用性的 。
聚类有效性验证效应分析噪音聚类N法水平分组系统聚类效应的显著性验证N法水平分组效应估计系统聚类噪音聚类图1 方法总体流程图2 数理统计学方法介绍2.1析因设计首先介绍几个基本概念 , 将影响语音识别系统性能的语音数据属性称为因素 。
。
9、如噪音场景、信噪比(SNR)、说话人性别、说话人口音、语速等 。
因素的取值或分类称为因素的水平 , 如“说话人性别”有两个水平:“男”和“女” 。
析因设计也叫做全因子实验设计 , 是根据因素的全组合安排试验的试验优化设计方法 。
析因设计就是实验中所涉及到的全部实验因素的各个水平的全面组合形成不同的实验条件 , 在每个实验条件下进行两次或两次以上的独立重复实验 。
析因设计的最大优点是所获得的信息量很多,可以准确地估计各实验因素的主效应的大小,还可估计因素之间各级交互作用效应的大小 。
本文采用析因设计方法来安排语音识别实验 。
2.2方差分析方差分析(analysis of variance,简称ANOVA)又称变异数分析 。
10、或F检验 , 其目的是推断两组或多组资料的总体均数是否相同 , 检验两个或多个样本均数的差异是否有统计学意义 , 是进行假设检验的一种很有效的方法 。
方差分析在一个或多个因素的不同水平或水平组合下测量一个定量反应变量 , 将对这个反应变量的总效应分解为由各因素引起的效应或因素的组合产生的交互效应以及随机误差效应;同时将总自由度分解为对应各部分自由度之和 。
例如在单因素方差分析中 , 统计量为F值 , 在一定的显著水平下如果F值大于F界值 , 说明该因素有统计学意义 , 即由它引起的效应是显著的 , 这就是方差分析的基本思想 。
方差分析的基本应用条件是各样本是相互独立的 , 各样本数据必须满足正态性和方差齐性 。
双因素方差分析的模型可以由如下 。
11、公式描述:(1)表示第一个因素的第个水平 , 表示第二个因素的第个水平 , 表示第k次实验当第一个因素取水平 , 第二个因素取水平时的性能指标值 。
表示第一个因素取水平时对性能指标的效应 。
表示第二个因素取水平对性能指标的效应 。
表示两个因素间交互作用的效应 。
表示第k次实验的随机实验误差 。
噪音场景对于系统性能的影响主要表现在训练数据、测试数据和两者交互作用(一致性)三个部分的效应 。
本文中将训练当成第一个因素 , 测试当成第二个因素 , 应用方差分析模型进行如下假设检验考察三者的效应 。
对场景因素 , 检验:对信噪比因素 , 检验:对交互作用 , 检验:方差分析采用分离偏差平方和以及自由度的方法 , 采用F分布检验以上几个原假设是否成立 。
。
12、本文主要运用方差分析法对噪音场景进行效应分析 。
3 效应分析基于识别系统性能影响的噪音场景聚类分析方法 , 其原理是依据噪音场景对系统性能的影响效应来对噪音场景进行聚类分析 。
在语音识别训练和测试数据上的分别加上不同的背景噪音形成不同的训练集和测试集 , 然后进行语音识别实验 , 得到的系统性能会有差异 。
这种差异主要是由于训练和测试数据不同造成的 , 本质上是由于所加的背景噪音不同造成的 。
我们运用统计学方法分析噪音场景对系统性能的影响效应 。
首先要验证效应的显著性 , 即验证由于噪音场景不同造成的系统性能的差异是显著的 , 训练和测试都存在影响系统性能的效应并且这两种效应都是显著的 。
并且通过分析我们会发现:噪音场景因素对 。
13、性能的影响作用不仅表现在训练和测试的效应上 , 还表现在训练和测试的一致性对性能的影响 , 即训练和测试还存在交互作用 , 交互效应同样也是显著的 。
其次作效应估计判别出效应的强弱 。
为了分析不同噪音间的训练、测试的效应以及训练与测试的交互效应 , 我们需要进行语音识别实验 , 通过给原始无噪数据加上各种不同的噪音形成不同的训练集和测试集 , 产生实验结果来研究由于噪音数据的不同导致的训练和测试的不同对于系统性能的影响效应 。
语音识别工具是利用剑桥大学开发的HTK开源工具搭建的大词汇连续语音识别系统LVCSR;声学模型采用三音子的隐马尔可夫模型 , 声学特征采用MFCC特征 。
稿源:(未知)
【傻大方】网址:/a/2021/0813/0023654548.html
标题:基于|基于语音识别系统性能影响的噪音场景分析( 二 )