卡饭网 > 科技 > 业界动态 > 正文

腾讯微视凭BLENDer模型斩获VCR竞赛榜第一

来源:PingWest品玩 作者:PingWest品玩 时间:2020-11-30 15:03:41

品玩11月30日讯,近日腾讯微视视频理解团队在多模态理解领域最权威排行榜之一 VCR 任务中荣登榜首。该团队提出的 BLENDer(BimodaL ENcoDer)  模型超越百度、谷歌、微软、Facebook 等多家研究机构的模型效果,一举成为单、多模型的三项指标第一,值得注意的是,BLENDer 仅凭单模型效果便超越了此前榜单上的多模型最好效果,赋予了机器更强大的理解和认知能力,并深度应用到短视频领域。

VCR 榜单是多模态理解领域最权威的排行榜之一,也是当前图像理解和多模态领域层次最深、门槛最高的任务之一,吸引了微软、谷歌、Facebook、百度、UCLA 等国内外公司和研究机构纷纷参与。而单模型 BLENDer 来自于腾讯微视视频理解团队,超越上一届榜首百度团队的多模态预训练模型 ERNIE-ViL-large 成为新的 VCR 榜单霸主。

据相关负责人介绍,BLENDer 模型已经应用到腾讯微视产品中,赋予了平台更强大的认知能力,使得包含文本、音频、视频等多种媒体信息在内的短视频内容,能够更好的做到分类和识别,更加精准理解和挖掘这些海量的跨媒体信息。例如当腾讯微视用户创作视频后平台可识别内容并精准推荐适合的话题,也能根据内容属性快速推荐给感兴趣的用户,增强创作内容的曝光。

相关推荐