小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超Open
无需文字标签,完全自监督的 Meta 视觉大模型来了!
小扎亲自官宣,发布即收获大量关注度 ——
在语义分割、实例分割、深度估计和图像检索等任务中,这个名叫 DINOv2 的视觉大模型均取得了非常不错的效果。
甚至有超过当前最好的开源视觉模型 OpenCLIP 之势。
虽然此前 Meta 就发布过自监督学习视觉大模型 DINO,不过这次 AI 识别图像特征的能力显然更进一步,准确分割出了视频中的主体:
换而言之,DINOv2 自己学会了找图像特征。
目前 Meta 官方不仅已经放出了开源代码,而且还给了网页版 Demo 试玩。有网友内涵:
什么叫开源,LLaMA,SAM,DINOv2 这才叫开源!
一起来看看,DINOv2 的效果究竟如何。
准确识别不同画风的同种物体
事实上,DINOv2 是基于上一代 DINOv1 打造的视觉大模型。
这个模型参数量是 10 亿级,也仍然是视觉 Transformer 架构,但与 DINO 不太一样的是,这次 DINOv2 在数据集上经过了精心挑选。
采用这类数据训练出来的视觉模型,效果如何?
这是 DINOv2 在 8 个视觉任务上的表现,包括语义分割、分类、深度估计等,其中橙色是自监督方法的效果,深粉色是弱监督方法的效果。
可以看见,经过自监督学习的视觉模型,表现上已经与经过弱监督学习的模型性能相当。
实际效果也不错,即便在一系列照片中,相同物体的画风并不相似,DINOv2 也能准确识别它们的特征,并分到相似的列表中。
如组中都具有翅膀的鸟和飞机、(b)组中的大象和大象雕塑、(c)组中的汽车和汽车玩具模型、(d)组中的马和涂鸦版马:
而且从 PCA图像效果来看,DINOv2 不仅能准确分类,还能用不同颜色标出它们“相同”的部分,例如象鼻都是绿色、车轮都是红色、马的尾巴是黄色等。
换而言之,DINOv2 能理解这些图像中的相似之处,就像人会形容飞机“看起来像一只鸟”一样。
目前 DINOv2 已经放出 Demo,我们也试了试它的实际效果。
Demo 直接可玩
据 Meta 介绍,这几个任务中,DINOv2 在大多数基准上超过了目前开源视觉模型中表现最好的 OpenCLIP。
我们先来看看深度估计的效果。
值得一提的是,在效果更好的情况下,DINOv2 运行的速度也比 iBOT 更快,相同硬件下只需三分之一的内存,运行速度就能比 DINOv2 快上 2 倍多。
这是 Meta 论文中与 OpenCLIP 在实际例子上的比较效果:
接下来是语义分割的效果,这里也先给出 Meta 论文中的数据对比情况:
那么,这样的自监督视觉大模型可以用在哪里?
从 Meta 给出的视频来看,目前有一些比较环保的用途,例如用于估计全球各地的树木高度:
除此之外,如同扎克伯格所说,DINOv2 还能被用于改善医学成像、粮食作物生长等。当然这里小扎还进一步强调:
可以被用于制作更具沉浸感的元宇宙。
嗯,看来 Meta 的元宇宙路线还将继续……
试玩 Demo 地址:
项目地址:
参考链接:
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
责任编辑:顾晓芸
最新阅读
-
“深交所·创享荟”打造资本市场服务国企改革新典范
9月27日,深交所举办第九期“创享荟”国企专业化整合专场活动。“创享荟”是深交所着力打造的具有深市特色的市场服务品牌,目前已围绕热点主题举办了多期专场活动,影响力和吸引力不断增强。 深交所相关负...
-
微软在GitHub上线开发工具包,助力开发者使用Rust语言编写Wind
,微软Azure首席技术官MarkRussinovich日前在X平台发文,公开微软最近宣布“扩大采用Rust语言的成果”,微软同时还在GitHub中发布了一系列开发工具包,让开发者可以使用Rust语言...
-
擦亮“金融为民”底色光大银行多维发力谱写“人民金融”新篇章
像这样面向听障人士的手语服务模式,光大银行已持续运行了四年。四年来,光大银行通过收集听障客群金融业务需求及沟通痛点,让金融服务更贴近听障人士的日常生活。而这,只是光大银行践行“金融为民”初心,努力提供...
-
云南信托联合多家金融机构进乡村开展金融知识普及教育
近日,为帮助广大农村群众进一步提升金融素养及金融风险防范意识,助力打造诚信、健康、安全、和谐的金融环境,在云南省农村信用社联合社、昆明市农村信用社联合社及昆明市西山区农村信用合作联社的共同协调组织下,...
-
“领头羊”计划走进广州番禺,超59家企业具备上市潜力
南方财经全媒体记者翁榕涛实习生曾日丽广州报道 9月26日下午,广州企业上市“领头羊”行动计划“番禺行动”启动仪式在番禺节能科技园交流中心举行。 据南方财经全媒体记者了解,今年7月以来,广州市地方金...
-
算力牛股中际旭创股价“反攻”800G能否助三季度业绩惯性增长?
21世纪经济报道记者雷晨实习生原婷婷北京报道 近期受国内外AI利好消息驱动,二级市场上,中际旭创股价重新抬头,9月26日、9月27日连续上涨。截至9月27日收盘,公司股价报收于114.07元/股,收...
-
索尼申请外置小型触摸屏专利,可“架在”PS5手柄上远程游玩游戏
,据外媒gamerant报道,索尼近日注册了一项新专利,从文件内容上来看,这项专利主要显示,外加可以使用一个“触摸屏”连接DualSense手柄,来游玩PS5游戏。 图源索尼 索尼于此前正式公布了...
-
14幅图看懂债市潮起潮落
超越城乡居民储蓄存款规模和A股总市值,拥有百万亿以上体量的债券。如同资产配置中的“米面粮油”,在投资中无处不在。相较于股票,您可能是更加委婉地参与其中,大部分人是通过银行理财、债券基金、保险、资管计划...
-
国庆黄金周运输今日启动,长三角铁路预计发送超250万人次
国庆黄金周运输启动。 9月27日,澎湃新闻记者从中国铁路上海局集团有限公司获悉,今天是铁路国庆黄金周运输首日,长三角铁路预计发送旅客逾250万人次,较2019年同期多发送60余万人次,增幅超三成。 ...
-
阿里拟分拆菜鸟在港上市菜鸟子公司已申请上百项物流专利
9月26日,阿里巴巴港交所公告,拟通过以菜鸟股份于香港联交所主板独立上市的方式分拆菜鸟。拟议分拆完成后,阿里巴巴将继续持有菜鸟50%以上的股份,菜鸟将仍为其子公司。 天眼查App显示,菜鸟网络科技有...