新智元报道
编辑:KingHZ
无需人工标注,吞下17亿张图片,Meta用自监督学习炼出「视觉全能王」!NASA已将它送上火星,医疗、卫星、自动驾驶领域集体沸腾。
17亿张图片,Meta训出70亿参数「视觉巨兽」DINOv3,完全开源了!
通过自监督学习(SSL)训练,DINOv3可生成强大且高分辨率的图像特征。
在多个密集预测任务中,这是单一固定的视觉主干网络第一次超越专用解决方案。
DINOv3重新定义计算机视觉性能天花板,在多个基准测试中刷新或逼近最佳成绩!
美国的NASA甚至已在火星探索上用上了DINOv3。这是真上天了!
就在大家以为Meta在AI竞赛上被淘汰之时,Meta这次总算扬眉吐气。
而且,这次Meta是真开源:DINOv3不仅可商用,还开源了完整的预训练主干网络、适配器、训练与评估代码等「全流程」。
项目地址:https://github.com/facebookresearch/dinov3
全部checkpoint:https://huggingface.co/collections/facebook/dinov3-68924841bd6b561778e31009
DINOv3亮点如下