Prompting to Adapt Foundational Segmentation Models - Details

author：

Indexed by：

Scopus

Abstract：

Foundational　segmentation　models,　predominantly　trained　on　scenes　typical　of　natural　environments,　struggle　to　generalize　across　varied　image　domains.　Traditional　＂training-to-adapt＇＇　methods　rely　heavily　on　extensive　data　retraining　and　model　architectures　modifications.　This　significantly　limits　the　models＇　generalization　capabilities　and　efficiency　in　deployment.　In　this　study,　we　propose　a　novel　adaptation　paradigm,　termed　＂prompting-to-adapt＇＇,　to　tackle　the　above　issue　by　introducing　an　innovative　image　prompter.　This　prompter　generates　domain-specific　prompts　through　few-shot　image-mask　pairs,　incorporating　diverse　image　processing　techniques　to　enhance　adaptability.　To　tackle　the　inherent　non-differentiability　of　image　prompts,　we　further　devise　an　information-estimation-based　gradient　descent　strategy　that　leverages　the　information　entropy　of　image　processing　combinations　to　optimize　the　prompter,　ensuring　effective　adaptation.　Through　extensive　experiments　across　nine　datasets　spanning　seven　image　domains　(i.e.,　depth,　thermal,　camouflage,　endoscopic,　ultrasound,　grayscale,　and　natural)　and　four　scenarios　(i.e.,　common　scenes,　camouflage　objects,　medical　images,　and　industrial　data),　we　demonstrate　that　our　approach　significant　improves　the　foundational　models＇　adaptation　capabilities.　Moreover,　the　interpretability　of　the　generated　prompts　provides　insightful　revelations　into　their　image　processing　mechanisms.　Source　code　is　available　at:　\urlgithub.com/yuema1303/Prompting-to-Adapt-FSM.　©　2024　ACM.

Keyword：

domain adaption foundational segmentation models

Community：

[ 1 ] [Hu J.]Contemporary Amperex Technology Company Limited, Ningde, China
[ 2 ] [Li J.]Fuzhou University, Fuzhou, China
[ 3 ] [Ma Y.]Xiamen University, Xiamen, China
[ 4 ] [Cao L.]Xiamen University, Xiamen, China
[ 5 ] [Zhang S.]Shanghai Jiao Tong University, Shanghai, China
[ 6 ] [Zhang W.]Chinese Academy of Science, Quanzhou, China
[ 7 ] [Jiang G.]Contemporary Amperex Technology Company Limited, Ningde, China
[ 8 ] [Ji R.]Xiamen University, Xiamen, China

Reprint 's Address：

Email：

Show more details

Related Keywords：

3-D Object Classification in Heterogeneous Point Clouds via Bag-of-Words and Joint Distribution Adaption
2019，IEEE GEOSCIENCE AND REMOTE SENSING LETTERS
Prompting to Adapt Foundational Segmentation Models
2024，32nd ACM International Conference on Multimedia, MM 2024

Source ：

Year： 2024

Page： 7104-7112

Language： English

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 2

Affiliated Colleges：

Get Fulltext

DOI Library Discovery Baidu Scholar Search SCOPUS

Type
Departments

All Years Choose Year From to