Share|安搭Share BLENDer模型斩获VCR竞赛榜第一

近日腾讯微视视频理解团队在多模态理解领域最权威排行榜之一 VCR 任务中荣登榜首。该团队提出的 BLENDer(BimodaL ENcoDer) 模型超越百度、谷歌、微软、Facebook 等多家研究机构的模型效果,一举成为单、多模型的三项指标第一,值得注意的是,BLENDer 仅凭单模型效果便超越了此前榜单上的多模型最好效果,赋予了机器更强大的理解和认知能力,并深度应用到短视频领域。
Share|安搭Share BLENDer模型斩获VCR竞赛榜第一】VCR 榜单是多模态理解领域最权威的排行榜之一,也是当前图像理解和多模态领域层次最深、门槛最高的任务之一,吸引了微软、谷歌、Facebook、百度、UCLA 等国内外公司和研究机构纷纷参与。而单模型 BLENDer 来自于腾讯微视视频理解团队,超越上一届榜首百度团队的多模态预训练模型 ERNIE-ViL-large 成为新的 VCR 榜单霸主。