8月2日至4日,實(shí)驗(yàn)室王嘉毅和王梓懿同學(xué)參加了在云南昆明舉辦的2023中國多媒體大會(ChinaMM2023),,并展示了論文《基于小波變換和平行注意力機(jī)制的多源遙感圖像分類方法》 ,、《基于旋轉(zhuǎn)目標(biāo)感知網(wǎng)絡(luò)的SAR船舶檢測方法》和《基于Transformer和通道混合并行卷積的高光譜圖像去噪方法》,。
基于小波變換和平行注意力機(jī)制的多源遙感圖像分類方法由王嘉毅和張?zhí)旄旰献魍瓿桑摲椒?gòu)建了基于小波變換的特征提取器,,能夠充分利用頻域分析技術(shù),在可逆下采樣的過程中充分捕捉粗/細(xì)粒度級別特征;同時(shí),,提出了基于平行注意力機(jī)制的特征融合器,充分綜合多模態(tài)遙感數(shù)據(jù)的一致性和差異性,,完成強(qiáng)相關(guān)性特征的融合和生成,,可以顯著提升多源遙感圖像分類的準(zhǔn)確率。
基于旋轉(zhuǎn)目標(biāo)感知網(wǎng)絡(luò)的SAR船舶檢測方法由王梓懿,、尹嘉豪,、黃博斌合作完成。為了解決目標(biāo)尺寸變化多樣的問題,,該方法主干網(wǎng)絡(luò)使用基于多尺度 Transformer 架構(gòu)的 PVTv2,,可以更好地保留特征圖的局部連續(xù)性,同時(shí)更好地融合圖像的多尺度特征,。同時(shí),,為了解決目標(biāo)有多種方向且訓(xùn)練樣本數(shù)量有限的問題,將旋轉(zhuǎn)邊界框與 RetinaNet 結(jié)合,,有效減少了背景冗余以及噪聲的干擾,。
基于Transformer和通道混合并行卷積的高光譜圖像去噪方法由胡帥、龔卓然,、上官心語合作完成,,模型包括三個(gè)關(guān)鍵模塊:通道混合特征提取模塊、基于塊下采樣的全局增強(qiáng)模塊和自適應(yīng)雙向特征融合模塊,。通過這三個(gè)模塊的相互作用,,可以充分結(jié)合全局和局部的特征信息,處理不同區(qū)域中的噪聲和紋理差異,,有效提高模型對空間細(xì)節(jié)信息的恢復(fù)能力,。
目前,這三個(gè)工作分別被推薦到《中國圖象圖形學(xué)報(bào)》和《北京航空航天大學(xué)學(xué)報(bào)》發(fā)表,。
2023中國多媒體大會由中國計(jì)算機(jī)學(xué)會(CCF),、中國圖像圖形學(xué)學(xué)會(CSIG)主辦,CCF多媒體技術(shù)專業(yè)委員會,、CSIG多媒體專業(yè)委員會,、云南大學(xué)承辦,,昆明理工大學(xué)、云南師范大學(xué)和云南民族大學(xué)聯(lián)合承辦,,參會人數(shù)超過1000人,,通過面對面交流,共同促進(jìn)多媒體領(lǐng)域的蓬勃發(fā)展,。