乐购汽车
您好,欢迎来到乐购汽车!
乐购汽车

  • 微型车

  • 小型车

  • 紧凑型车

  • 中型车

  • 中大型车

  • 豪华车

  • MPV

  • SUV

  • 跑车

  • 面包车

  • 电动车
  • 首页
  • 车讯
  • 新车
  • 选车
  • 排行
  • 试驾
  • 车企
  • 导购
  • 行情
  • 用车
  • 厂商
  • 维修
  • 热点
您的当前位置:乐购汽车 > 热点 >
何恺明团队12页论文新作剑指AIGC!“新CLIP”只需一个trick,
2022-12-19 11:54编辑:sh-ad来源:IT之家   阅读量:10674   

感谢本站网友三库的线索传递!

何明凯的队伍又是新来的。

这一次,他们的成就围绕着最热门的AIGC背后的剪辑。

——只是在模型的极简结构上,应用了简单的蒙版,使得新模型的速度快了3.7倍。

同时,性能可以提高而不是降低。

该团队表示,希望他们的工作能够帮助未来的视觉语言模型实现规模化。

这一波,让大家大呼:是何明凯,还是熟悉的味道~

没错,也是《大道至简》的手感。

就连论文也一如既往的只有12页,没有一个公式。

让我们一起阅读。

介绍MAE—like面膜

本文提出了一种快速,简单,有效的训练CLIP的方法。

快速的语言图像预训练也很直接。

简单来说,就是基于原有的CLIP架构,随机屏蔽输入图像边上的图像块,然后只对可见块进行编码。

原始剪辑架构

说白了就是把类似MAE的思想引入到了CLIP架构中,于是FLIP架构就变成了这样。

这样可以减少计算量,提高训练效率,同时学习更多的图文样本,每次迭代可以比较更多的样本,但保持相似的内存使用。

具体来说,本文使用ViT作为图像编码器。

首先将图像划分成一个不重叠的网格,随机覆盖大部分块本文采用的遮阳比例为50%和75%然后ViT只对块进行编码,时间复杂度降低到二分之一或四分之一

同样的方法也可以用于文本屏蔽但研究人员认为,由于文本编码器相对较小,加速效果无法带来整体增益

可是,与MAE不同的是,这次FLIP没有重建被阻止的图像内容,也没有解码器。

MAE建筑

因为他们发现放弃解码和重构可以产生更好的速度虽然编码器是在蒙版图像上预先训练的,但它可以直接应用于完整的图像

相同的性能,3.7倍的速度

总的来说,与CLIP相比,带掩膜机制的FLIP在精度和训练时间上取得了平衡,即在训练时间大幅减少的情况下,性能不降反升。

——尤其是当面膜程度高达50%,75%的时候。

其中,当mask=75%时,当FLIP的性能与基线模型剪辑相同时,训练速度为3.7x

这意味着这个夹子大约需要2500 TPU日培训完成后,FLIP可以节省大约1800 TPU日

这个结果是在ImageNet—1K验证集上的零炮传递任务中得到的每个具有不同掩码比例的模型都在LAION—400M上进行了6.4,12.8或32个历元的训练,包含4亿个图文对

然后,在ImageNet—1K分类数据集的三个主要指标上,采用64k批量,50%掩码比和无掩码微调的FLIP也取得了比CLIP更好的性能。

注:比他们复制的片段好,比原片段差一点当然,两个片段的数据集是不同的

但在大量基于各种数据集的下游任务中,FLIP也显示出了优势,基本全线碾压CLIP。

最后,翻转模型的放大也是一大亮点,效果显著。

可以看出,当FLIP的模型规模和数据规模增大时,FLIP继续上升,尤其是模型规模增大时但是单纯增加训练时长基本没用

从下表也可以看出,模型规模和数据规模一起增加,效果达到了一个新的高度证明大模型+大数据好

何明凯是通讯员。

三个人一起工作,都是公平研究工程师。其中包括:

李,本硕毕业于北京大学计算机专业,发表过多篇顶级会议,

齐昊,毕业于CMU机器人学院,

胡荣航2020年毕业于清华大学学士,加州大学伯克利分校博士。

何明凯和他的同事克里斯托弗费希滕霍费尔有同样的指导贡献。

还有一点

值得一提的是,有细心的网友统计了近三年CVPR被引用次数最高的论文,分别是Moco,SimSiam和MAE。

这三篇文章唯一的合著者是何,还有两篇还是著作,都是和自我监督学习有关的根据谷歌的学术统计,目前,他们的引用分别为5224,1374和834

大神明凯还是一如既往的稳扎稳打~

你认为他们队的最新杰作怎么样。

比如,为什么随机遮罩图像面片,反而让模型性能不降反升。

纸质链接:

参考链接:

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

分享到:
  • 最新阅读
  • 满载续航超800公里首批特斯拉Semi电动卡车交付
    满载续航超800公里首批特斯拉Semi电动卡车交付

    日前,特斯拉在内华达超级工厂举行Semi电动半挂卡车交付仪式,向百事可乐交付首批新车这意味着第一辆能够长途行驶的电动卡车即将投入运营特斯拉的使命是加速世界向可持续能源的转变,继续引...

    2022-12-19 11:15
  • 赛道街道皆有我道运动型纯电轿跑合创A06成都上市会
    赛道街道皆有我道运动型纯电轿跑合创A06成都上市会

    12月3日在广州,杭州交付上市的首款轿跑A06也于12月18日晚在成都上市场地是成都北湖的亚铁兽户外体验中心三面环水,风格清新,汽车文化浓郁,是新车上市的好地方下午4点开始的试驾让...

    2022-12-19 11:12
  • 深圳南山携手分期乐商城发1000万元消费券助力消费复苏
    深圳南山携手分期乐商城发1000万元消费券助力消费复苏

    日前,深圳市南山区政府携手乐心分期商城,启动HiGo南山看深圳美好生活线上电商推广活动分期商城透露,此次将发放1000万元代金券,预计拉动消费2亿元,助力南山商业企业和制造业企业发...

    2022-12-19 11:09
  • 冬季无忧出行与哈弗H6国潮版温暖过冬
    冬季无忧出行与哈弗H6国潮版温暖过冬

    2022FIFA世界杯卡塔尔2022本周进入了激动人心的决赛阶段冠军的悬念即将揭晓,足球的激情再次席卷全球在我国,大雪节后,雨雪频繁光顾北方多地,尤其是新疆,内蒙古等地,给人们的出...

    2022-12-19 10:46
  • 细腻豪华对阵粗犷豪放——现代进口帕里斯帝与长安福特探险者谁更懂家庭?
    细腻豪华对阵粗犷豪放——现代进口帕里斯帝与长安福特探险者谁更懂家庭?

    伴随着中国汽车市场的快速发展,品牌和车型层出不穷选择的多样化无疑让很多车主眼花缭乱再加上最近几年来二胎开放,多人口家庭激增,三口之家的五座出行时代逐渐推进到四口之家的六座出行时代对...

    2022-12-19 10:36
热门
小鹏G9将于9月21日上市;法拉利入门敞篷Roma Spider谍照曝光

小鹏G9将于9月21日上

不足12万元起买领克,领克06到底香不香?

不足12万元起买领克,领

  • 交通银行举办上海金融科技国际论坛“新领域
  • 提升交通参与者的路权意识
  • 展会为期10天最低票价50元第二十届广州
  • 比亚迪11月销量破23万墨西哥市场同添喜
  • 成立19年再迎里程碑东风日产第1500万
聚焦
  • ·未变!奇瑞回复“立讯成为第一大股东”传闻
  • ·荣获2021版C-NCAP首个MPV五星
  • ·缩小版丰田埃尔法,中兴推出微型电动车
  • ·奔驰、特斯拉都羡慕!艾瑞泽8站在10万A
  • ·配置提升明显中期改款起亚K3将2023年
  • ·MGMULAN推出限时保价政策
  • ·远程获海外5000辆新能源商用车订单11
  • ·岚图汽车卢放:面对困难,勇做追光者
  • ·微软ProjectKodiak曝光,将提
  • ·前10月中国汽车商品出口金额前十国累计出
图文
3款中国SUV霸榜全球热门车TOP5,中国造被认可了?其实,差很远!

3款中国SUV霸榜全球热

8月轿车销量排行榜出炉,轩逸力压比亚迪秦夺冠,宏光MINI第三

8月轿车销量排行榜出炉,

  • 博格华纳收购Drivetek
  • 政策“交棒”市场,新能源汽车需重新出发
  • 新能源汽车装上“中国芯”
  • 酷的二次方之哈弗酷狗×酷狗音乐K歌大赛,
  • 支持AirTag,苹果macOS更新进一
速递
  • ·17天翻倍!感冒药占了一半营收,公司:有
  • ·本田中国11月终端汽车共计销售78126
  • ·新能源汽车专用产品系列:嘉实多E启护Ca
  • ·自己换屏129.99美元,iFixit推
  • ·极氪001累计交付突破7万台使用全新HM
乐购汽车网站地图免责声明
2017- legou.qcdg.cn All Rights Reserved. 乐购汽车 版权所有
备案号:沪ICP备2022017705号   客服联系方式:jokeryouxiang@163.com