Segment Anything Model (SAM)
Meta AI 推出的 Foundation 影像分割模型,具備可提示、高品質遮罩與 zero-shot 泛化能力。
社群:
產品概覽
Segment Anything Model (SAM) 是什麼?
Segment Anything Model (SAM) 是由 Meta AI Fundamental AI Research (FAIR) 團隊開發的先進影像分割模型。以目前最大規模的分割資料集訓練(超過 11 萬張影像與 11 億個遮罩),SAM 可根據多元提示(如點、框、文字)產生精準分割遮罩。其架構包含影像編碼器、提示編碼器與輕量化遮罩解碼器,實現即時遮罩產生與強大的 zero-shot 效能,無需額外訓練即可應用於各種分割任務。SAM 讓影像分割更普及,簡化標註流程,並支援從醫學影像到環境監測等多元應用。
主要功能
可提示式分割 (Promptable Segmentation)
可依據彈性提示(如點選、框選、粗略遮罩或文字輸入)產生精確的分割遮罩。
Foundation Model 架構
結合 transformer 影像編碼器、提示編碼器以及輕量化遮罩解碼器,優化即時互動分割。
超大規模訓練資料集
以 SA-1B 資料集訓練,涵蓋超過 11 萬張影像及 10 億個遮罩,具備廣泛泛化能力與 zero-shot 遷移。
Zero-Shot 泛化能力
能於全新影像領域與任務中分割物件,無需針對任務進行額外訓練或微調。
開源且可擴充
以 Apache 2.0 授權釋出,程式碼、模型與資料集皆可用於學術與商業用途。
即時效能
高效遮罩解碼,約 50 毫秒即可產生遮罩,支援互動式應用。
使用案例
- AI 輔助影像標註 : 自動產生分割遮罩以協助人工標註,大幅提升標註流程效率。
- 醫學影像 : 可精確分割解剖結構或病灶,協助診斷與治療規劃。
- 環境與衛星影像 : 精準分割衛星影像,利於地表分類、災害應變及氣候監測。
- 擴增實境與視覺特效 : 支援即時物件分割,應用於 AR 與後製視覺特效。
- 機器人與自駕車 : 分割物件以提供場景理解,協助導航與互動。
常見問題
Segment Anything Model (SAM) 的替代方案
Roboflow
全方位電腦視覺平台,協助開發者與企業打造、訓練並部署自訂AI模型,流程順暢、基礎架構可擴展。
Labelbox
全面的數據標註和模型評估平台,用於為機器學習應用構建高品質訓練數據集。
V7 Labs
AI 平台以 GenAI 工具為多元產業提供先進標註與自動化工作流程。
CVAT
業界領先的機器學習資料標註平台,使團隊能夠使用多種標註類型和基於雲端的儲存對影像和影片進行標註。
Playment
全託管資料標註平台,為大規模訓練與驗證電腦視覺模型,提供高品質標註資料集。
SuperAnnotate
全面的資料標註平台,通過專業標註團隊在多種資料類型上構建高品質訓練資料集。
Encord
全方位多模態 AI 資料平台,簡化視覺、音訊、文字與醫療資料的標註、管理與評估流程。
Landing AI
領先的視覺AI平台,讓深度學習電腦視覺方案能以資料為核心快速建立、部署與擴展。
Segment Anything Model (SAM) 網站分析
🇨🇳 CN: 10%
🇺🇸 US: 9.97%
🇪🇸 ES: 6.23%
🇮🇳 IN: 6.08%
🇭🇰 HK: 4.11%
Others: 63.61%
