該論文發(fā)表于KDD '24: Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining(CCF A),,題目為《Brant-X: A Unified Physiological Signal Alignment Framework》,。
浙江大學(xué)的張道澤為論文的第一作者,浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院副教授楊洋為本文通訊作者,。
論文鏈接:
https://doi.org/10.1145/3637528.3671953
源碼鏈接:
https://github.com/zjunet/Brant-X/
Brant-X是一個新提出的生理信號對齊框架,,旨在通過建模腦電圖(EEG)與其他生理信號(如眼電圖EOG,、心電圖ECG和肌電圖EMG,統(tǒng)稱為EXG)之間的相關(guān)性,,提升多種健康監(jiān)測和疾病診斷場景下的性能,。Brant-X利用預(yù)訓(xùn)練的EEG基礎(chǔ)模型和兩級對齊策略,,實現(xiàn)了從EEG到其他生理信號的數(shù)據(jù)高效知識轉(zhuǎn)移。在睡眠階段分類,、情緒識別等多個下游任務(wù)中,,Brant-X展現(xiàn)了卓越的性能,超越了現(xiàn)有的任務(wù)特定和任務(wù)無關(guān)的基線方法,。
生理信號是了解人體各種生理狀態(tài)的重要線索,。盡管現(xiàn)有研究多集中于單一類型的生理信號,但人體作為一個整體的生物系統(tǒng),,各生理數(shù)據(jù)之間的內(nèi)在聯(lián)系不容忽視,。尤其是大腦作為生命活動的控制中心,EEG與其他生理信號之間存在顯著的相關(guān)性,,這對于改善多種健康監(jiān)測和疾病診斷場景下的性能至關(guān)重要,。然而,實現(xiàn)這些生理信號之間的有效對齊和分析仍面臨挑戰(zhàn),,包括多類型生理數(shù)據(jù)的稀缺性、不同生理信號之間的固有屬性差異,,以及不同應(yīng)用場景下的任務(wù)需求差異,。
針對這些挑戰(zhàn),本研究提出了統(tǒng)一的生理信號對齊框架Brant-X,。該框架通過預(yù)訓(xùn)練的EEG基礎(chǔ)模型,、采樣增強和兩級對齊策略,實現(xiàn)了從EEG到其他生理信號的數(shù)據(jù)高效知識轉(zhuǎn)移,,以適應(yīng)不同下游任務(wù)的需求,,并提高了下游任務(wù)的性能。
Brant-X框架的整體流程如圖1所示,。首先,,基于EEG基礎(chǔ)模型,通過同時采集的EEG和EXG數(shù)據(jù)之間的對齊來訓(xùn)練EXG編碼器,。然后,,能夠從EEG和EXG信號中學(xué)習(xí)強表示的EEG和EXG編碼器被應(yīng)用于不同場景下的各種下游任務(wù)(包括睡眠階段分類、情緒識別,、凍結(jié)步態(tài)檢測和眼動通信等),。
圖1 生理信號對齊框架Brant-X概述
Brant-X的總體架構(gòu)如圖2所示。通過結(jié)合預(yù)訓(xùn)練的EEG基礎(chǔ)模型和兩級對齊策略,,實現(xiàn)了EEG與其他生理信號(EXG)之間的有效對齊,。
圖2 Brant-X的結(jié)構(gòu)。在數(shù)據(jù)準備階段,,對EXG數(shù)據(jù)進行升采樣和降采樣,,以增強數(shù)據(jù),。然后,將EEG和EXG數(shù)據(jù)分別輸入EEG編碼器和EXG編碼器,,以獲得數(shù)據(jù)片段的表示,。最后,通過兩級對齊將同時采集的EEG和EXG片段以及相應(yīng)的EEG和EXG序列進行對齊,。
1. 預(yù)訓(xùn)練的EEG基礎(chǔ)模型
Brant-2的腦信號基礎(chǔ)模型由超過1B個參數(shù)組成,,并在多達近4TB的混合數(shù)據(jù)(包括來自26個受試者的2.3TBiEEG數(shù)據(jù)和來自約15,000個受試者的1.6TBEEG數(shù)據(jù))上進行了預(yù)訓(xùn)練,可以從EEG信號中學(xué)習(xí)到強大的表示,。更重要的是,,它使用了不同采樣率的預(yù)訓(xùn)練數(shù)據(jù),從而提高了對采樣率變化的魯棒性,。
2. 數(shù)據(jù)分片
鑒于生理數(shù)據(jù)是生物電信號,,生理狀態(tài)的語義信息只能通過多個采樣點共同表達而不是單個采樣點。因此,,本文將整個數(shù)據(jù)序列分割成多個連續(xù)的片段,,以聚合片段內(nèi)的語義信息,減少計算需求,。
3. 采樣增強
EXG信號的采樣率差異很大,,本文采用了采樣增強技術(shù)來提高模型對采樣率變化的魯棒性。具體來說,,如圖2左下方所示,,將原始數(shù)據(jù)的采樣率提高到原來的兩倍,又將其采樣率降低到原來的一半,,從而得到兩組采樣率不同的增強數(shù)據(jù),。
4. 潛在空間嵌入
通過EEG和EXG編碼器,從原始的生理信號中提取關(guān)鍵特征,,如圖2中間部分所示,,這些特征能夠捕捉信號的重要屬性和模式。將高維的生理信號數(shù)據(jù)轉(zhuǎn)換為低維的潛在空間表示,,這有助于減少數(shù)據(jù)的復(fù)雜性,,同時保留最重要的信息,也為后續(xù)的片段級對齊和序列級對齊提供基礎(chǔ),。
5. 兩級對齊
觀察到任務(wù)之間的差距主要源于相關(guān)語義尺度的不同,,為了解決各種信號和任務(wù)之間的差距,本文引入了兩級對齊,,在片段級和序列級全面對齊EEG和EXG信號的語義,,以克服固有差異,捕捉不同語義尺度的EEG和EXG之間的相關(guān)性,。
利用上述方法,,EEG的數(shù)據(jù)和模型資源被擴展到其他生理信號的研究中,,為各種生理信號之間的相關(guān)性建模鋪了新的道路。
作者總結(jié)了現(xiàn)有的公共多類型生理數(shù)據(jù)集,,以實現(xiàn)從EEG到EXG的數(shù)據(jù)高效知識轉(zhuǎn)移,。為了對同時記錄的EEG和任意EXG數(shù)據(jù)進行對齊,用于無監(jiān)督對齊的訓(xùn)練數(shù)據(jù)由3個數(shù)據(jù)集組成:CAP,、ISRUC和HMC,,包括EEG、EOG,、ECG和EMG信號,。總體而言,,對齊訓(xùn)練數(shù)據(jù)包括來自267名受試者的359條記錄。為了驗證Brant-X的有效性,,本文設(shè)置了四個下游任務(wù),,包括睡眠階段分類、情緒識別,、凍結(jié)步態(tài)檢測和眼動交流,。
(1)下游任務(wù)數(shù)據(jù)集
(2)Baselines
大量實驗表明,Brant-X在涉及EEG和EXG信號的不同場景中的各種下游任務(wù)上實現(xiàn)了SOTA性能,,如圖3所示,,這說明了本文的框架在各種場景中的有效性,。
圖3 各個任務(wù)上的整體性能比較
每個任務(wù)的詳細比較如下表格所示:
表1 睡眠分期任務(wù)上的平均表現(xiàn)
表2 情緒識別任務(wù)上的平均表現(xiàn)
表3 FoG檢測任務(wù)上的平均表現(xiàn)
表4 眼動交流任務(wù)上的平均表現(xiàn)
四個下游任務(wù)的消融實驗對比結(jié)果見圖4。這表明,,Brant-X在所有任務(wù)的所有指標上都優(yōu)于其他變體,,證明了該框架中每個組件的貢獻。
圖4 所有下游任務(wù)消融實驗的結(jié)果
本文首次提出了統(tǒng)一的生理信號配準框架Brant-X,。它基于預(yù)訓(xùn)練的EEG模型,,通過兩級對齊策略將EEG知識遷移到其他生理信號,為跨生理信號研究提供了新路徑,,并預(yù)示著在健康監(jiān)測和疾病診斷領(lǐng)域的廣泛應(yīng)用前景,。
撰稿人:張志航
審稿人:潘家輝