反例指导的数据扩增( 二 )
该方案返回一个扩增集和一个误差表 , 该扩增集将用于重新训练已处理的模型 , 该误差表的分析可以确定反例之间的共同特征 , 并帮助采样器选择候选反例 。
图像生成器我们的反例扩增方案的核心是一个图像生成器 , 可渲染逼真的道路场景的合成图像 。 由于反例是由合成数据生成器生成的 , 因此我们对生成的数据的基本事实标签有充分的了解 。 例如 , 在我们的案例中 , 当图像生成器将汽车放置在特定位置时 , 我们确切地知道了它的位置和大小 , 从而相应地确定了地面真实边界框 。
抽样方法采样器的目的是提供对修改空间的良好覆盖 , 并确定其具体化导致反例的样本 。 以下简要介绍一些我们集成到框架中的采样方法:
- 均匀的随机采样:均匀的随机采样可确保从 M 采样任何点的概率均等 , 从而保证了训练和测试过程中生成图像的良好混合 。 尽管这是一种既简单又有效的训练和测试技术 , 但它可能无法很好地覆盖修改空间 。
- 低差异采样:低差异序列是 n 元组序列 , 比不相关的随机点更均匀地填充 nD 空间 。 低差异序列通过减少间隙和点的聚类来覆盖检测框 , 从而确保对样本空间的均匀覆盖 。
- 交叉熵抽样:交叉熵方法是一种用来组合优化和重要性抽样的通用蒙特卡洛方法 。 这是一种迭代采样技术 , 我们从给定的概率分布中采样 , 然后通过最小化交叉熵来更新分布 。
错误表扩增方案的每次迭代都会产生一个示例 , 其中包含指向学习模型局限性的信息 。 希望提取与反例相关的模式 , 并使用此信息有效地生成新的反例 。 因此 , 我们将错误表定义为数据结构 , 据列由跨生成的图像的重要特征组成 。 错误表分析可用于:
1.提供有关反例的说明 ,
2.生成反馈以采样新的反例 。
【反例指导的数据扩增】在第一种情况下 , 通过在各个示例中找到共同的模式 , 我们向用户提供了反馈 , 例如“该模型未检测到在森林道路上驶离我们的白色汽车”;在第二种情况下 , 我们可以使采样器的修改偏向于更可能导致反例 。
实验评估在所有实验中 , 我们分析了 squeezeDet , 这是一种用于自动驾驶的 CNN 实时物体检测器 。 所有模型都接受了 65 个时期的训练 。
原始训练和测试集 X 和 T 分别包含由我们的图像生成器随机生成的 1500 和 750 张图片 。 初始精度 accfx(T)=(0.9847 , 0.9843)相对较高 。 但是 , 我们能够在准确度较低的训练集上生成与 T 一样大的反例集 , 表格中突出显示的条目显示最佳性能 。 报告的值是五个不同实验的平均值 。
表 1:扩增循环
文章插图结论在本文中 , 我们提出了一种通过反例扩增机器学习(ML)数据集的技术 。 我们生成的示例是由 M* 模型错误分类的综合生成的数据项 。 由于这些项目是通过算法合成的 , 因此它们的地面真实标签也将自动生成 。 我们展示了如何使用错误表来有效地指导扩增过程 。 训练深度神经网络的结果表明 , 我们的扩增技术在图像分类方面比标准扩增方法表现更好 。 此外 , 当我们迭代扩增循环时 , 在计算上很难找到反例 。 我们还表明 , 错误表可以通过较小的数据扩增有效地提高准确性 。
我们注意到 , 我们提出的方法还可以扩展到“系统级”分析和验证中使用反例 , 可以在周围环境的背景下分析整个系统的正确性 。 使用此类“语义反例”执行数据扩增是未来工作的有趣方向 。
我们的方法可以看作是反例指导的归纳综合(CEGIS)的实例 , 它是程序综合的常见范例 。 我们的案例是 M* 模型 。 CEGIS 本身是 Oracle 引导归纳综合的特例 。 未来 , 探索使用除产生反例的 Oracle 以外的其他 Oracle 来扩增数据集 , 并将我们的以反例为指导的数据扩增技术与其他以 oracle 为指导的数据扩增方法进行比较将是很有意思的 。
最后 , 在这项工作中 , 我们决定完全依赖模拟的综合数据 , 以确保训练 , 测试和反例集来自同一数据源 。 将我们的扩增方法扩展到现实世界中的数据将会很有趣 。 例如 , 在驾驶过程中收集的道路场景图像 。 因此需要使用诸如领域适应或迁移学习之类的技术 , 它们可以使新生成的数据适应现实世界 。
- 智能手机市场|华为再拿第一!27%的份额领跑全行业,苹果8%排在第四名!
- 会员|美容院使用会员管理软件给顾客更好的消费体验!
- 行业|现在行业内客服托管费用是怎么算的
- 人民币|天猫国际新增“服务大类”,知舟集团提醒入驻这些类目的要注意
- 国外|坐拥77件专利,打破国外的垄断,造出中国最先进的家电芯片
- 技术|做“视频”绿厂是专业的,这项技术获人民日报评论点赞
- 面临|“熟悉的陌生人”不该被边缘化
- 中国|浅谈5G移动通信技术的前世和今生
- 页面|如何简单、快速制作流程图?上班族的画图技巧get
- 桌面|日常使用的软件及网站分享 篇一:几个动态壁纸软件和静态壁纸网站:助你美化你的桌面
