該論文2022年發(fā)表于機(jī)器學(xué)習(xí)領(lǐng)域新興期刊Transactions on Machine Learning Research (TMLR),,荷蘭代爾夫特理工大學(xué)的Anuj Singh是第一作者,,荷蘭皇家殼牌集團(tuán)技術(shù)公司的Hadi Jamali-Rad是通訊作者,。該文章在paper with code上是FSL領(lǐng)域的sota,。
論文概要
背景:人類具備從極少樣本中快速學(xué)習(xí)的能力,而深度學(xué)習(xí)通常需要海量數(shù)據(jù)才能達(dá)到良好性能,。為應(yīng)對樣本匱乏的問題,,少樣本分類(Few-Shot Classification)成為研究熱點(diǎn)。作者提出了一種將圖像表示解耦為語義潛變量和標(biāo)簽潛變量的方法,,同時設(shè)計了基于注意力的AttFEX模塊,,來捕捉跨樣本的特征。
方法:
圖1 整體架構(gòu)
研究方法
(1)變分推斷:
將特征分開學(xué)習(xí),,通過將特征建模為標(biāo)簽潛變量Zl和語義潛變量Zs,,簽潛變量Zl需要同時負(fù)責(zé)重構(gòu)和判斷標(biāo)簽。在分類時以Zs輔助去掉無關(guān)分類的信息,。
此外,,為了找到近似后驗(yàn),,通過ELBO推導(dǎo)出證據(jù)下界:
(2)AttFEX
使用注意力捕捉支持集和查詢集的特征,。先通過1*1卷積擴(kuò)展通道,,再通過自注意力捕捉跨樣本特征,,并與原始特征相乘,,得到任務(wù)感知圖,。
(3)元學(xué)習(xí)訓(xùn)練策略:
借鑒經(jīng)典的MAML,通過元更新加速新類別的適應(yīng),。
偽代碼部分如下,,分為在基類上訓(xùn)練和在新類上直推:
實(shí)驗(yàn)結(jié)果
作者一共在三種數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)(miniImagenet,、tieredImagenet,、cross),,結(jié)果表明,,所提出的方法取得了很好的性能,遠(yuǎn)超第二名,。且作者僅使用性能低下的特征提取器ConV4就超越了其他所有方法,。
可視化
作者對兩個變分變量的方法進(jìn)行了可視化處理,,證明確實(shí)可以讓特征更加可分,,Zl的區(qū)分度明顯提高,。
結(jié)論
在本文中,,作者提出了一種將特征通過變分網(wǎng)絡(luò)解耦并通過注意力捕捉跨樣本特征的小樣本方法,。該方法很好地解耦了潛在特征,,使其能有效提高小樣本的分類性能,。本文自2022年發(fā)表以來一直是paper with code上的sota,表明了其方法的先進(jìn)性,。
撰稿人:陳泉霖
審稿人:李景聰