按关键词阅读: 分析 系统 语音 影响 基于 性能 识别 场景 噪音
我们用了单因素方差分析和双因素方差分析两种方式进行训练效应分析 , 进而分别运用N法和系统聚类法进行聚类 。
4.1 聚类方法(1)N法(水平分组)适用于单因素方差分析 , 其思想是首先将各水平均值按大小次序排列 , 计算相邻两水平均值之差;其次根据公式2计算t检验中的判别尺度 , 并与每个均值差进行比较 , 凡比大的地方就划分为不同的两个组;最后判断在组内离组内均值距离最远的那个水平均值是否该留在组内 , 如果留在组内 , 这组似乎不需要再分;如果最远的均值不能留在组内 , 将它从该组剔出 , 对剩下的均值 。
21、继续进行考察 , 直至没有一个均值能剔出为止 。
判断能否剔除的统计量为 , 如公式3所示 。
近于正态分布 , 用正态表的临界值来进行判断 , 如果就将该组中与总均值离的最远的那个均值剔出这个组 。
(2) (3)表示同一水平试验的重复数;表示试验误差的均方;表示试验误差的自由度;是显著性水平通常取0.05;是查t表上的值 。
表示该组的水平个数;表示该组个均值与总平均之差最大者 。
(2)系统聚类依据双因素方差分析对训练效应的估计值(相似度) , 采用自底向上的系统聚类方法对数据进行聚类 , 合并的过程为选择相似度最大的两类进行合并 , 直到任意类之间的相似度小于我们给定的显著性水平为止 。
这个显著性水平通常取0.01 , 这样做可以降低犯第 。
22、一类错误的概率11 。
4.2 聚类结果表5. 聚类结果及各种不同场景训练下相同测试集识别下得到的识别正确率对照表N法聚类结果加噪训练的噪音场景系统聚类结果加噪训练的噪音场景识别正确率类别1白噪声类别1白噪声7.26%类别2飞机场飞机场12.69%类别3工厂类别2工厂21.93%不加噪训练不加噪训练22.70%办公室办公室23.27%类别4商场类别3商场28.82%羽毛球场羽毛球场29.40%人群人群29.93%教室教室29.95%超市超市30.64%食堂食堂31.03%庭院庭院31.07%餐厅餐厅31.73%类别5大街上类别4大街上33.34%汽车内汽车内34.05%出租车内出租车内34.79% 。
【基于|基于语音识别系统性能影响的噪音场景分析】23、十字路口篮球场35.28%篮球场十字路口35.92%公交车站公交车站36.32%公交车内公交车内36.94%5 聚类合理性验证从表6聚类结果与识别正确率的对照表中可以直观看出类内性能差别不大 , 而类间性能差别较大 。
现通过识别实验对噪音场景聚类结果合理性进行客观验证 。
从各类中随机抽选1种场景 , 每种场景按固定比例对原始训练数据进行叠加 , 形成一个训练集 。
重复四次得到四个训练集 , 分别进行语音识别训练 , 得到四个训练模型 , 再用同一个测试集(包含各种不同噪音场景)进行测试 。
测试结果如表6所示 。
运用方差分析法对测试结果进行假设检验 , 分析结果如表7所示 。
得到四个模型之间的非显著性概率Pr=0.814420.05 ,。
24、即四个模型的系统性能是不显著的 。
从而验证了类内场景对于系统性能的影响是不显著的 。
由于不同类间的任意两个场景对于系统性能的影响都是显著的(对应Pr值都小于0.05) , 从而也验证了类间场景对于系统性能的影响是显著的 。
通过实验 , 本文对于噪音场景的聚类分析方法的合理性和有效性得到了验证 。
表6 测试结果训练模型字错误率1:factorytaxirestaurantwhite60.08%2:factorybuseaterycockpit61.35%3:officevehicleyardwhite62.29%4:officetaxisupermarketcockpit60.81%表7 Matlab单因素方差 。
25、分析表SourceSSdfMSFProbFColumns0.005656630.00188550.315090.81442Error0.45479760.0059841Total0.46045796 总结本文是基于噪音场景对于语音识别系统性能的影响 , 实现对于噪音场景的聚类分析 。
本文对基于语音识别系统性能影响的噪音场景分析方法进行了比较全面的介绍 , 包括如何运用数理统计学方法对噪音场景进行效应分析以及依据效应分析实现聚类 。
该方法对比于其他基于声学特征的聚类方法 , 是完全从系统性能角度出发 , 将复杂繁多的噪音场景归纳为几个典型大类 , 使得类内噪音场景对系统性能影响不显著 , 类间噪音场景对系统性能影响显著 。
而 。
26、基于声学特征的聚类有可能不能完全反映噪音场景对系统性能的影响 , 并且基于声学特征的聚类分析方法会根据选取不同的声学特征而得到不同的聚类结果 。
基于本文的方法可以得到唯一的聚类结果 。
该方法同样还可以用于分析其他影响系统性能的因素 , 如信噪比、口音等等 。
稿源:(未知)
【傻大方】网址:/a/2021/0813/0023654548.html
标题:基于|基于语音识别系统性能影响的噪音场景分析( 四 )