该机制不仅可以降低模型的计算复杂度 , 还能提高生成结果的质量 。
此外 , 模型还使用VQ-GAN替代VQ-VAE进行视觉tokenization , 这也让生成效果好上加好 。
团队介绍
一作Chenfei Wu , 北京邮电大学博士毕业 , 现工作于微软亚研院 。
共同一作Jian Liang ,来自北京大学 。
其余作者包括微软亚研院的高级研究员Lei Ji , 首席研究员Fan Yang , 合作首席科学家Daxin Jiang , 以及北大副教授方跃坚 。
通讯作者为微软亚研院的高级研究员&研究经理段楠 。
- 霍金|霍金留下三个预言,每一个都事关人类安危,第一个已经开始应验
- 三星|德媒:中国或许将成为下一个全球创新总部!
- 女娲|进化论是西方独有吗,其实中国早有“进化”思想
- 数字货币|你的“花呗”额度降了吗?“借呗”整改后下一个来了,有用户直接被停
- Windows|New Windows 11操作系统壁纸灵感来源,新的视角,一个新的时代
- 奥陌陌|奥陌陌:人类观察到的第一个外星文明迹象?留下了哪些未解之谜?
- 联想|拆解联想电脑,没有任何一个核心零部件是国产的,塑料壳和螺丝是国产的
- 物联网|物联网解决方案的前端开发
- 伏羲女娲图|破译《伏羲女娲图》中蕴藏的宇宙奥秘!
- UFO|詹姆斯韦伯遇到了一个小问题,全面测试导致发射延迟了几天