傻大方


首页 > 学习 >

基于|基于不均衡样本重构的加权在线贯序极限学习机( 四 )



按关键词阅读: 基于 样本 在线 均衡 极限 学习机 加权


分别以每个种子样本为中心 , 生成虚拟样本并筛选 , 最终得到均衡的初始训练样本集 。
使用改进SMOTE算法前后2010年的样本数目如表4 。
由表4可知 , 经改进SMOTE算法处理之后 , 两类样本的数据比近似于11 , 从而解决了离线阶段的数据不均衡问题 。
利用处理后的均衡离线样本集 , 建立 。

23、初始模型 。
给定隐层激活函数为RBF核函数 , 对2011的数据进行在线贯序训练 。
图6和图7分别为随隐层节点个数变化 , ISWOSELM、MCOSELM、OSELM和ELM的训练精度和测试精度的变化 。
设定隐节点个数为30 , 分别用ISWOSELM、OSELM、ELM和MCOSELM四种算法对气象数据进行仿真实验 , 表5为四种算法运行30次所得结果的平均性能比较 。
从表5中可以看出 , 尽管ISWOSELM对多类样本的识别率略有下降 , 总体测试精度也未达到最佳 , 但其少类训练精度和测试精度均明显优于其他三种算法 , 其中少类测试精度分别比其他三种算法提高了22.87%、25.76%和22.42% , 因而大大减少了少类样 。

24、本的误判率 。
从另一个方面来说 , ELM和OSELM多类测试精度明显较高 , 恰恰表明直接对类别严重不均衡的样本分类 , 分类面更加偏向于少类样本 , 从而造成多类样本分类效果的“虚假”提升 。
是否应为图6和图7?图6和图7中 , 随隐层节点变化 , 四种算法的图形均有一定程度的波动 , 这是ELM本身的随机性所致 。
但不难发现 , 较其他三种算法 , ISWOSELM的图形波动相对较小 , 表现出良好的稳健性 。
从表5可以看出 , ISWOSELM的训练时间与其他三种算法接近 , 但少类的测试精度明显提高 , 由此可以看出 , 在不增加算法时间复杂度的前提下 , ISWOSELM对少类样本的识别率更高 , 更适合于不均衡在线贯序数据的分类问题 。
4 结语 本文 。

25、提出了一种基于不均衡样本重构的加权在线贯序极限学习机 , 继承了OSELM算法在线、快速学习的特点 , 通过引入主曲线提取数据的分布特性 , 减少了少类样本合成过程的盲目性 , 在不影响算法计算复杂度的情况下 , 明显提高了少类样本的分类精度 , 对解决实际气象问题具有重要的理论和工程意义 。
但本文所提算法有一定的局限性 , 主要针对典型的二分类问题 , 对多分类不均衡问题并未很好解决 。
因此 , 完善并改进该算法 , 是下一步研究的方向 。
参考文献: 1TAO X ,HAO S ,ZHANG D ,et al.Overview of classification algorithms for unbalanced data J. Jo 。

26、urnal of Chongqing University of Posts and Telecommunications: Natural Science Edition ,2013 ,25(1): 101-121. (陶新民 , 郝思媛 , 张冬雪 , 等.不均衡数据分类算法的综述J. 重庆邮电大学学报:自然科学版 , 2013 , 25(1):101-121.) 2CHAWLA N ,BOWYER K ,HALL L ,et al. SMOTE: Synthetic minority oversampling technique J. Journal of Artificial Intelligence R 。

27、esearch ,2002 ,16(1): 321-357. 3YANG Z ,QIAO L ,PENG X. Research on datamining method for imbalanced dataset based on improved SMOTE J. Acta Electronica Sinica ,2007 ,35(12A): 22-26.(杨智明 , 乔立岩 , 彭喜元.基于改进SMOTE的不平衡数据挖掘方法研究J.电子学报 , 2007 , 35(12A):22-26.) 4ZHAI Y ,MA N ,RUAN D ,et al. An effective oversampling。

28、method for imbalanced data sets classification J. Chinese Journal of Electronics ,2011 ,20(3): 489-494. 5XU D ,WANG Y ,CAI L. ISMOTE algorithm for imbalanced data sets J. Journal of Computer Applications ,2011 ,31(9): 2399-2401.(许丹丹 , 王勇 , 蔡立军.面向不均衡数据集的ISMOTE算法J. 计算机应用 , 2011 , 31(9):2399-2401.) 6LIANG N Y ,。

29、 HUANG G B ,SARATCHANDRAN P ,et al. A fast accurate online sequential learning algorithm for feedforword networks J. IEEE Transactions on Neural Networks ,2006 , 17(6): 1411-1423. 7HUANG G B ,ZHOU H ,DING X ,et al. Extreme learning machine for regression and multiclass classification J. IEEE Transacti 。

30、ons on Systems ,Man ,and Cybernetics Part B: Cybernetics ,2012 ,42(2): 513-529. 8YANG L ,ZHANG R. Online sequential ELM algorithm and its improvement J. Journal of Northwest University: Natural Science Edition ,2012 ,42(6): 885-896.(杨乐 , 张瑞.在线序列ELM算法及其发展J. 西北大学学报:自然科学版 , 2012 , 42(6):885-896.) 9ZHANG J ,W 。

31、ANG J. An overview of principal curves J. Chinese Journal of Computers ,2003 ,26(2): 129-146.(张军平 , 王钰. 主曲线研究综述J. 计算机学报 , 2003 , 26(2):129-146.) 10LIU Y ,LIU S ,LIU T ,et al. New oversampling algorithm DB_SMOTE J. Computer Engineering and Applications , 2014 , 50(6): 92-95.(刘余霞 , 刘三民 , 刘涛 , 等.一种新的过采样算法DB_SMOTEJ.计算机 。


稿源:(未知)

【傻大方】网址:/a/2021/0821/0023864697.html

标题:基于|基于不均衡样本重构的加权在线贯序极限学习机( 四 )


上一篇:新视野大学英语视听说|基于《新视野大学英语视听说》教程的大学口语课程教学方法研究

下一篇:爱心|爱心主题晚会主持稿