2020学术会议回顾:从这些最佳论文中一窥研究趋势( 三 )


此外 , 该研究基于此度量指标提出了一个元基准 , 它可以系统性地将任意图像理解任务转换成流图像理解任务 。 研究人员主要关注城市视频流中的目标检测和实例分割任务 , 并创建了具备高质量、时序稠密标注的新数据集 。
该研究提出的解决方案及其实证分析结果显示:
在帕累托最优延迟-准确率曲线上 , 存在能够最大化流准确率的最优点;异步跟踪和未来预测很自然地成为流图像理解的内部表征;动态调度可用于克服时间混叠(temporalaliasing) , 得到一个吊诡的结果:什么都不做可能使延迟最小化 。最佳论文荣誉提名2:NeRF:RepresentingScenesasNeuralRadianceFieldsforViewSynthesis
论文链接:https://arxiv.org/abs/2003.08934
简介:该研究提出了一种在合成复杂场景新视图任务中实现SOTA结果的新方法 , 该方法通过使用稀疏的输入视图集来优化基础的连续体场景函数 。 该算法使用全连接深度网络表示场景 , 其输入为单个连续5D坐标(空间位置(x,y,z)和视角方向(θ,φ)) , 输出为体积密度和在此空间位置上的视图相关emittedradiance 。 该研究通过查询沿着摄像头光线的5D坐标来合成视图 , 并使用经典的体渲染技术将输出颜色和密度投影到图像中 。
由于体渲染本身是可微的 , 因此优化表征所需的唯一输入是一组具备已知摄像机位姿的图像 。 研究者介绍了如何高效优化神经辐射场(neuralradiancefield) , 渲染出逼真的具备复杂几何形状和外观的场景新视图 , 而且其在神经渲染和视图合成方面的效果优于之前的工作 。
ICRA2020
最佳论文:Preference-BasedLearningforExoskeletonGaitOptimization
论文链接:https://arxiv.org/abs/1909.12316
简介:这项研究展示了如何利用「个人偏好」 , 来定制化提升人类使用下肢外骨骼的舒适感 。 以往 , 机械外骨骼一直被美国军队视为提升士兵作战能力的工具 , 但加州理工和清华大学的这项研究在未来或许可为数千万残障人士带来帮助 。 该研究提出了一种叫做COSPAR的算法 , 它可以将合作学习应用于下肢外骨骼操作时对人类偏好的适应 , 并在模拟和真人实验中进行了测试 。
CoRL2020
最佳论文:LearningLatentRepresentationstoInfluenceMulti-AgentInteraction
论文链接:https://arxiv.org/pdf/2011.06619.pdf
简介:与机器人进行无缝交互非常困难 , 因为智能体是不稳定的 。 它们会根据ego智能体的行为更新策略 , ego智能体必须预见到可能的变化才能做到共同适应(co-adapt) 。 受人类行为的启发 , 研究者认识到机器人不需要明确地建模其他智能体将执行的每一个低级操作 。 相反 , 它可以通过高级表示来捕获其他智能体的潜在策略 。
该研究提出一个基于强化学习的框架 , 用来学习智能体策略的潜在表示 , 其中ego智能体确定其行为与另一智能体未来策略之间的关系 。 然后ego智能体利用这些潜在动态来影响其他智能体 , 有目的地指导制定适合共同适应的策略 。 在多个模拟域和现实世界曲棍球游戏中 , 该方法优于其他方法 , 并学会影响其他智能体 。
最佳系统论文:SMARTS:ScalableMulti-AgentReinforcementLearningTrainingSchoolforAutonomousDriving
论文链接:https://arxiv.org/pdf/2010.09776.pdf
简介:多智能体交互是现实世界自动驾驶领域的基础组成部分 。 经历十几年的研究和发展 , 如何与多样化场景中各类道路使用者进行高效交互的问题依然未能很好地解决 。 学习方法可以为解决该问题提供很大帮助 , 但这些方法需要能够产生多样化和高效驾驶交互的真实多智能体模拟器 。
所以 , 为了满足这种需求 , 来自华为诺亚方舟实验室、上海交大和伦敦大学学院的研究者开发了一个名为SMARTS(ScalableMulti-AgentRLTrainingSchool)的专用模拟平台 , 该平台支持多样化道路使用者行为模型的训练、积累和使用 。 这些反过来又可以用于创建日益真实和多样化的交互 , 从而能够对多智能体交互进行更深更广泛的研究 。
最佳Presentation论文:AcceleratingReinforcementLearningwithLearnedSkillPriors
论文链接:https://arxiv.org/pdf/2010.11944.pdf
2020学术会议回顾:从这些最佳论文中一窥研究趋势】简介:智能体在学习新任务时严重依赖之前的经验 , 大部分现代强化学习方法从头开始学习每项任务 。 利用先验知识的一种方法是将在之前任务中学到的技能迁移到新任务中 。 但是 , 随着之前经验的增加 , 需要迁移的技能也有所增多 , 这就对在下游学习任务中探索全部可用技能增加了挑战性 。 还好 , 直观来看 , 并非所有技能都需要用相等的概率进行探索 , 例如当前状态可以提示需要探索的技能 。