該論文發(fā)表于KDD '24: Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining(CCF A),題目為《Brant-X: A Unified Physiological Signal Alignment Framework》,。
浙江大學的張道澤為論文的第一作者,,浙江大學計算機科學與技術學院副教授楊洋為本文通訊作者。
論文鏈接:
https://doi.org/10.1145/3637528.3671953
源碼鏈接:
https://github.com/zjunet/Brant-X/
Brant-X是一個新提出的生理信號對齊框架,旨在通過建模腦電圖(EEG)與其他生理信號(如眼電圖EOG,、心電圖ECG和肌電圖EMG,,統(tǒng)稱為EXG)之間的相關性,提升多種健康監(jiān)測和疾病診斷場景下的性能,。Brant-X利用預訓練的EEG基礎模型和兩級對齊策略,,實現(xiàn)了從EEG到其他生理信號的數(shù)據(jù)高效知識轉移。在睡眠階段分類,、情緒識別等多個下游任務中,,Brant-X展現(xiàn)了卓越的性能,超越了現(xiàn)有的任務特定和任務無關的基線方法,。
生理信號是了解人體各種生理狀態(tài)的重要線索,。盡管現(xiàn)有研究多集中于單一類型的生理信號,但人體作為一個整體的生物系統(tǒng),,各生理數(shù)據(jù)之間的內(nèi)在聯(lián)系不容忽視,。尤其是大腦作為生命活動的控制中心,EEG與其他生理信號之間存在顯著的相關性,,這對于改善多種健康監(jiān)測和疾病診斷場景下的性能至關重要,。然而,實現(xiàn)這些生理信號之間的有效對齊和分析仍面臨挑戰(zhàn),,包括多類型生理數(shù)據(jù)的稀缺性,、不同生理信號之間的固有屬性差異,以及不同應用場景下的任務需求差異,。
針對這些挑戰(zhàn),,本研究提出了統(tǒng)一的生理信號對齊框架Brant-X。該框架通過預訓練的EEG基礎模型,、采樣增強和兩級對齊策略,,實現(xiàn)了從EEG到其他生理信號的數(shù)據(jù)高效知識轉移,以適應不同下游任務的需求,,并提高了下游任務的性能,。
Brant-X框架的整體流程如圖1所示,。首先,,基于EEG基礎模型,通過同時采集的EEG和EXG數(shù)據(jù)之間的對齊來訓練EXG編碼器,。然后,,能夠從EEG和EXG信號中學習強表示的EEG和EXG編碼器被應用于不同場景下的各種下游任務(包括睡眠階段分類、情緒識別,、凍結步態(tài)檢測和眼動通信等),。
圖1 生理信號對齊框架Brant-X概述
Brant-X的總體架構如圖2所示。通過結合預訓練的EEG基礎模型和兩級對齊策略,實現(xiàn)了EEG與其他生理信號(EXG)之間的有效對齊,。
圖2 Brant-X的結構,。在數(shù)據(jù)準備階段,對EXG數(shù)據(jù)進行升采樣和降采樣,,以增強數(shù)據(jù),。然后,將EEG和EXG數(shù)據(jù)分別輸入EEG編碼器和EXG編碼器,,以獲得數(shù)據(jù)片段的表示,。最后,通過兩級對齊將同時采集的EEG和EXG片段以及相應的EEG和EXG序列進行對齊,。
1. 預訓練的EEG基礎模型
Brant-2的腦信號基礎模型由超過1B個參數(shù)組成,,并在多達近4TB的混合數(shù)據(jù)(包括來自26個受試者的2.3TBiEEG數(shù)據(jù)和來自約15,000個受試者的1.6TBEEG數(shù)據(jù))上進行了預訓練,可以從EEG信號中學習到強大的表示,。更重要的是,,它使用了不同采樣率的預訓練數(shù)據(jù),從而提高了對采樣率變化的魯棒性,。
2. 數(shù)據(jù)分片
鑒于生理數(shù)據(jù)是生物電信號,,生理狀態(tài)的語義信息只能通過多個采樣點共同表達而不是單個采樣點。因此,,本文將整個數(shù)據(jù)序列分割成多個連續(xù)的片段,,以聚合片段內(nèi)的語義信息,減少計算需求,。
3. 采樣增強
EXG信號的采樣率差異很大,,本文采用了采樣增強技術來提高模型對采樣率變化的魯棒性。具體來說,,如圖2左下方所示,,將原始數(shù)據(jù)的采樣率提高到原來的兩倍,又將其采樣率降低到原來的一半,,從而得到兩組采樣率不同的增強數(shù)據(jù),。
4. 潛在空間嵌入
通過EEG和EXG編碼器,從原始的生理信號中提取關鍵特征,,如圖2中間部分所示,,這些特征能夠捕捉信號的重要屬性和模式。將高維的生理信號數(shù)據(jù)轉換為低維的潛在空間表示,,這有助于減少數(shù)據(jù)的復雜性,,同時保留最重要的信息,也為后續(xù)的片段級對齊和序列級對齊提供基礎,。
5. 兩級對齊
觀察到任務之間的差距主要源于相關語義尺度的不同,,為了解決各種信號和任務之間的差距,,本文引入了兩級對齊,在片段級和序列級全面對齊EEG和EXG信號的語義,,以克服固有差異,,捕捉不同語義尺度的EEG和EXG之間的相關性。
利用上述方法,,EEG的數(shù)據(jù)和模型資源被擴展到其他生理信號的研究中,,為各種生理信號之間的相關性建模鋪了新的道路。
作者總結了現(xiàn)有的公共多類型生理數(shù)據(jù)集,,以實現(xiàn)從EEG到EXG的數(shù)據(jù)高效知識轉移,。為了對同時記錄的EEG和任意EXG數(shù)據(jù)進行對齊,用于無監(jiān)督對齊的訓練數(shù)據(jù)由3個數(shù)據(jù)集組成:CAP,、ISRUC和HMC,,包括EEG、EOG,、ECG和EMG信號,。總體而言,,對齊訓練數(shù)據(jù)包括來自267名受試者的359條記錄,。為了驗證Brant-X的有效性,本文設置了四個下游任務,,包括睡眠階段分類,、情緒識別、凍結步態(tài)檢測和眼動交流,。
(1)下游任務數(shù)據(jù)集
(2)Baselines
大量實驗表明,,Brant-X在涉及EEG和EXG信號的不同場景中的各種下游任務上實現(xiàn)了SOTA性能,如圖3所示,,這說明了本文的框架在各種場景中的有效性,。
圖3 各個任務上的整體性能比較
每個任務的詳細比較如下表格所示:
表1 睡眠分期任務上的平均表現(xiàn)
表2 情緒識別任務上的平均表現(xiàn)
表3 FoG檢測任務上的平均表現(xiàn)
表4 眼動交流任務上的平均表現(xiàn)
四個下游任務的消融實驗對比結果見圖4。這表明,,Brant-X在所有任務的所有指標上都優(yōu)于其他變體,,證明了該框架中每個組件的貢獻。
圖4 所有下游任務消融實驗的結果
本文首次提出了統(tǒng)一的生理信號配準框架Brant-X,。它基于預訓練的EEG模型,,通過兩級對齊策略將EEG知識遷移到其他生理信號,為跨生理信號研究提供了新路徑,,并預示著在健康監(jiān)測和疾病診斷領域的廣泛應用前景,。
撰稿人:張志航
審稿人:潘家輝