2020年人工智能论文总结 论文总结( 二 )



学习使用白盒卡通表现来卡通化[12]
人工智能可以绘制任何你想要的图片或视频!

从单一图像对人类进行神经再现[14]
该算法将人物的姿态和形状表示为参数化网格 , 该网格可以从单幅图像中重建 , 并且容易放置 。给定一个人的图像 , 他们可以从另一个输入图像中获得该人的不同姿势或不同衣服的合成图像 。

I2L-MeshNet:图像到像素预测  , 用于从单个RGB图像进行精确的3D人体姿态和网格估计[15]
目的是提出一种新的技术来估计三维人体姿态和网格从单一的RGB图像 。他们称之为I2L-MeshNet 。l代表“到图像像素” 。正如体素、体+像素是三维空空间中的量化单元一样 , 它们将lixel、线、像素定义为一维空空间中的量化单元 。他们的 比之前的 更好 , 而且代码是公开的!

超越导航图:连续环境中的视觉和语言导航[16]
语言导航是一个被广泛讨论的范畴 , 也是一个非常复杂的范畴 。一个人很容易穿过一栋房子拿走你放在床头柜上的咖啡 。但这是AI特工的另一回事 。它是一个自主的人工智能驱动的系统 , 应用深度学习来履行义务 。

RAFT:用于光流的循环全对场变换[17]
普林斯顿大学团队获得ECCV 2020年更佳论文奖 。他们为光流开发了一种新的端到端可训练模型 。他们的 超过了跨多个数据集的最新架构的准确性 , 并且更加有效 。

众数采样全光函数[18]
利用从互联网上获得的公开照片 , 他们可以重建旅游场景的多个视点 , 从而保留真实的阴影和灯光!这是对现实场景渲染中使用的更先进技术的巨大改进 , 其结果简直令人惊叹 。

通过深层潜在空间翻译恢复旧照片[19]
想象一下 , 你奶奶18岁的时候 , 她的老照片 , 折叠过的 , 甚至撕过的照片 , 都是毫无瑕疵 , 清清楚楚的 。这就是所谓的老照片的复原 , 本文只是应用深度学习的 来探索解决这个问题的新途径 。

支持可审计自治的神经回路策略[20]
来自澳大利亚IST大学和麻省理工学院的研究人员成功应用了一种新的人工智能系统来训练主动驾驶汽车 , 该系统基于小动物(如线虫)的大脑 。他们做到了这一点 。与流行的深度神经 (如Inceptions、Resnets或VGG)所需的数百万神经元相比 , 只有少数神经元能够主动掌握驾驶汽车 。他们的 只用75000个参数(19个掌握神经元而不是几百万个参数)就完全掌握了汽车!

寿命年龄转换综合[21]
Adobe Research的一组研究人员开发了一种新的技术 , 只根据这个人的一张照片进行年龄转换合成 。它可以从你发送的任何图片中生成不同年代的图片 。

去醛化[22]
DeOldify是一种对旧的黑白图像甚至电影图片进行着色和恢复的技术 。它是由Jason Antic开发的 , 目前仍在更新中 。现在 , 这是黑白图像着色的最新技术 , 一切都是开源的 , 但我们稍后会再次讨论 。

COOT:用于视频-文本表示学习的合作分层转换器[23]
顾名思义 , 它使用Transformer将视频及其一般描述作为输入 , 为每个视频序列生成精确的文本描述 。

风格化的神经绘画[24]
这种意象转绘画的翻译  , 要用一种新鲜的 去模仿各种风格的真正的画家 , 而且不涉及任何甘建筑 , 和所有最新的 都不一样!

实时人像抠图真的需要绿屏吗?[25]
面临灭绝是一个非常有趣的义务 。目的是找到图片中的任何人 , 并从其中删除背景 。因为义务的复杂性 , 需要找到一个或几个侧面很完美的人 , 这确实很难实现 。在这篇文章中 , 我将回顾这些年来应用的更佳技术以及将于2020年11月29日宣布的一种新 。许多技术正在应用基本的计算机视觉算法来完成这一任务 , 例如GrabCut算法 , 它非常快 , 但不是非常准确 。

ADA:用有限的数据训练生成性对抗 [26]
在NVIDIA开发的这种新的训练 的帮助下 , 你可以使用十分之一的图像来训练扩展代模型!让很多不能访问太多图像的应用成为可能!

在立方体球体上使用深度卷积神经 改进数据驱动的全球天气预测[27]
目前 , 传统的天气预报 采用我们称之为"数值天气预报"的模式 。它应用大气和海洋的数学模型 , 根据当前条件预测天气 。20世纪20年代首次提出 , 50年代用计算机模拟 , 取得了真实的结果 。这些数学模型可用于预测短期和长期预测 。但是它的计算量很大 , 它的预测不能像深度神经 那样基于那么多的数据 。这是它如此有前途的部分原因 。这些当前的数值天气预报模型已经应用机器学习作为后处理工具来改进预报 。天气预报越来越受到机器学习研究者的重视 , 并取得了良好的效果 。