精品国产三级a∨在线欧美,97无码精品人妻毛片,亚洲人成电影网站色

腦機(jī)接口與混合智能研究小組

更多動(dòng)態(tài)

1009

2024-11-27

本文的標(biāo)題為《EEGPT: Pretrained Transformer for Universal and Reliable Representation of EEG Signals》,，作者團(tuán)隊(duì)為哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院李海峰教授團(tuán)隊(duì),。該論文提交至NeurIPS 2024并錄用，探討了通用且可靠的腦電圖（EEG）信號(hào)特征表示的預(yù)訓(xùn)練Transformer模型EEGPT（EEG Pretrained Transformer）,。

論文鏈接：https://openreview.net/forum?id=lvS2b8CjG5

論文概要

EEGPT是一種新提出的,、具有1000萬(wàn)參數(shù)的預(yù)訓(xùn)練Transformer模型，旨在為EEG信號(hào)的特征提取提供通用而可靠的表示,。本文提出用于通用 EEG 特征提取的EEGPT 模型,，設(shè)計(jì)了雙自監(jiān)督學(xué)習(xí)方法,，結(jié)合時(shí)空表示對(duì)齊和掩碼重建，提高特征質(zhì)量和模型收斂性,，為 EEG 信號(hào)處理提供有效的創(chuàng)新解決方案,。與其他自監(jiān)督學(xué)習(xí)方法相比，EEGPT通過(guò)引入時(shí)空表示對(duì)齊技術(shù),，構(gòu)建了一個(gè)自監(jiān)督任務(wù),，專注于高信噪比和豐富語(yǔ)義信息的EEG表示。這種方法有效緩解了從低信噪比的原始信號(hào)提取特征時(shí)常見(jiàn)的質(zhì)量問(wèn)題,。此外,，EEGPT的分層結(jié)構(gòu)能夠分別處理空間和時(shí)間信息，從而降低計(jì)算復(fù)雜性,，提高對(duì)腦機(jī)接口（BCI）應(yīng)用的靈活性和適應(yīng)性,。實(shí)驗(yàn)結(jié)果驗(yàn)證了EEGPT在多種下游任務(wù)中的有效性和可擴(kuò)展性，達(dá)到了最先進(jìn)的性能,。

研究背景

EEG動(dòng)態(tài)反映大腦功能狀態(tài),，廣泛應(yīng)用于情緒識(shí)別、運(yùn)動(dòng)想象分類等多個(gè)領(lǐng)域,。目前EEG研究面臨數(shù)據(jù)層面的多樣性,、模型層面的專業(yè)化和預(yù)訓(xùn)練及遷移學(xué)習(xí)方法的局限性，面臨的挑戰(zhàn)包括低信噪比,、高個(gè)體間變異性以及EEG信號(hào)的任務(wù)依賴性變化,。這些問(wèn)題使得從EEG信號(hào)中提取穩(wěn)健的通用表示變得復(fù)雜，當(dāng)前EEG研究多針對(duì)特定任務(wù)或數(shù)據(jù)集設(shè)計(jì),，缺乏通用性和跨任務(wù)能力,。

自監(jiān)督學(xué)習(xí)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和語(yǔ)音分析等領(lǐng)域展現(xiàn)了顯著優(yōu)勢(shì),，許多最先進(jìn)的模型通過(guò)自監(jiān)督學(xué)習(xí)在大數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,，并針對(duì)特定應(yīng)用進(jìn)行微調(diào)，從而有效降低了對(duì)大量標(biāo)記數(shù)據(jù)的需求,。盡管近年來(lái)在EEG分析中應(yīng)用自監(jiān)督學(xué)習(xí)技術(shù)取得了良好效果,，但現(xiàn)有的掩碼自編碼器技術(shù)難以捕捉EEG數(shù)據(jù)的時(shí)序依賴，限制了遷移學(xué)習(xí)的效果,，尤其是在處理低SNR信號(hào)時(shí)的特征提取質(zhì)量,。

研究方法

EEGPT提出了一種基于時(shí)空一致性的雙自監(jiān)督EEG通用表示方法，主要包括以下幾個(gè)關(guān)鍵技術(shù)要點(diǎn)：

時(shí)空表示對(duì)齊：通過(guò)對(duì)齊預(yù)測(cè)特征與動(dòng)量編碼器的輸出,，增強(qiáng)編碼器提取穩(wěn)健特征的能力,。此方法確保編碼器輸出包含高質(zhì)量的全局特征，顯著減少計(jì)算復(fù)雜性。
掩碼重構(gòu)：使用掩碼自監(jiān)督學(xué)習(xí)任務(wù),，EEGPT不僅重構(gòu)原始波形,，還將預(yù)測(cè)的EEG信號(hào)特征與完整的EEG信號(hào)特征進(jìn)行對(duì)齊，提高模型的表示質(zhì)量和魯棒性,。
局部時(shí)空嵌入：通過(guò)將EEG信號(hào)劃分為均勻大小的塊進(jìn)行處理,，結(jié)合通道嵌入信息，提升模型對(duì)不同EEG采集設(shè)備的兼容性,。這種方法有助于提取宏觀特征,，忽略較小尺度的噪聲信號(hào)。
線性探測(cè)方法：在下游任務(wù)中,，采用線性探測(cè)法,，凍結(jié)預(yù)訓(xùn)練模型的參數(shù)，僅調(diào)整附加模塊的參數(shù),，以減少過(guò)擬合風(fēng)險(xiǎn)并優(yōu)化計(jì)算資源的使用,。

EEGPT的結(jié)構(gòu)如圖1所示,。模型將EEG信號(hào)（M個(gè)通道和T個(gè)時(shí)間點(diǎn)）分為若干個(gè)patch,，并通過(guò)局部時(shí)空嵌入將每個(gè)patch作為token嵌入，然后分別分為有無(wú)掩碼的patch使用時(shí)空表示對(duì)齊和掩碼重建,。最后,，線性探測(cè)方法用于應(yīng)用在下游任務(wù)中。

1. 時(shí)空表示對(duì)齊

掩碼自動(dòng)編碼器是一種去噪自動(dòng)編碼器來(lái)學(xué)習(xí)特征,，通過(guò)將被隨機(jī)patch掩碼遮擋的信號(hào)輸入到編碼器中,，解碼器預(yù)測(cè)掩碼patch的原始嵌入，如公式1所示：

其中⊙表示逐元素乘積,，是掩碼塊,，and 分別是編碼器和解碼器，是學(xué)習(xí)表示,，是相似性度量,。通過(guò)最小化損失函數(shù)，模型學(xué)習(xí)輸入信號(hào)的最佳表示,。,，在類BERT模型中編碼器和解碼器沒(méi)有分割，沒(méi)有明確表示,，本文在EEGPT模型中添加了時(shí)空表示對(duì)齊分支來(lái)顯式表達(dá),，這也就是雙自監(jiān)督方法，能夠鼓勵(lì)編碼表示具有更大程度的語(yǔ)義,，提高編碼質(zhì)量和泛化能力,，如公式2所示：

時(shí)空表示對(duì)齊方法將預(yù)測(cè)特征和動(dòng)量編碼器的輸出對(duì)齊，增強(qiáng)了編碼器提取魯棒特征的能力，確保編碼器的輸出包含高質(zhì)量的全局特征,。本文采用編碼器和預(yù)測(cè)器來(lái)解耦空間和時(shí)間特征,，能夠降低計(jì)算復(fù)雜度。

編碼器

編碼器整合了來(lái)自掩碼patch的空間信息,，公式3描述了編碼器（ENC）如何處理時(shí)間j處的所有掩碼,，并產(chǎn)生相應(yīng)的輸出特征。

預(yù)測(cè)器

如公式4所示,，預(yù)測(cè)器（PRED）利用來(lái)自編碼器掩碼部分的特征,，結(jié)合時(shí)間位置信息，來(lái)預(yù)測(cè)完整的編碼特征,。本文采用了旋轉(zhuǎn)位置嵌入方法來(lái)生成,，引入相對(duì)位置和時(shí)間信息。為了生成屬于M的預(yù)測(cè)特征,，使用可學(xué)習(xí)的向量查詢作為查詢標(biāo)記,，在自監(jiān)督訓(xùn)練中鼓勵(lì)編碼器提取token之間相關(guān)性信息。

動(dòng)量編碼器

動(dòng)量編碼器與編碼器的結(jié)構(gòu)相同,，每次訓(xùn)練迭代后,，編碼器的參數(shù)以的系數(shù)累積到動(dòng)量編碼器中，如公式5所示,。

并使用基于均方誤差（MSE）的對(duì)齊損失來(lái)實(shí)現(xiàn)時(shí)空表示對(duì)齊,，LN表示層歸一化，有助于減輕極值和協(xié)變量偏移的影響,，如公式6所示,。

2. 掩碼重構(gòu)

基于掩碼的重建方法將重建器生成的重建patch與原始的patch進(jìn)行對(duì)齊。

重建器

如公式7所示,，重建器（REC）利用編碼器編碼的M部分的特征和預(yù)測(cè)器預(yù)測(cè)的M部分的特征,，以及時(shí)間位置，生成重建的patch ,。

掩碼重建時(shí)使用基于均方誤差的重建損失來(lái)實(shí)現(xiàn)的,，如公式8所示。

最后通過(guò)將和相加構(gòu)建完整的預(yù)訓(xùn)練損失,。

3. 局部時(shí)空嵌入

局部時(shí)空嵌入方法首先在時(shí)空維度上對(duì)EEG信號(hào)進(jìn)行分塊和嵌入編碼,，然后將其輸入編碼器，如圖2所示,。首先對(duì)EEG信號(hào)進(jìn)行分割,，在時(shí)空維度上劃分為大小相等的塊，如公式10所示,。

其中d表示patch的時(shí)間長(zhǎng)度,，是時(shí)間patch的數(shù)量,。此后結(jié)合嵌入信息線性地嵌入patch，構(gòu)造一個(gè)集合其中包含所有可學(xué)習(xí)的通道嵌入向量和從通道名稱到通道嵌入向量,，使得模型能夠適應(yīng)多個(gè)數(shù)據(jù)集,，提高通道適應(yīng)性。最后得到的token由patch線性嵌入后得到,，如公式11所示,。

基于自監(jiān)督學(xué)習(xí)任務(wù)，提取的patch特征是互相可預(yù)測(cè)的,，可以忽略較小尺度的噪聲信息,。該方法旨在提取跨越更大尺度的宏觀特征，這些特征更容易識(shí)別且認(rèn)為是有意義的特征,。

4. 線性探測(cè)方法

在下游任務(wù)中,，使用預(yù)訓(xùn)練的編碼器并連接額外的模塊來(lái)進(jìn)行分類。如圖3所示,，該方法凍結(jié)預(yù)訓(xùn)練模型中的參數(shù),，僅更改附加線性模塊中的參數(shù)。該模塊包括用于對(duì)齊EEG和模型之間通道的自適應(yīng)空間濾波器（1*1卷積）,，以及將特征映射到網(wǎng)絡(luò)最后一層的輸出logits的線性層,，連接多分類頭進(jìn)行多分類任務(wù)。

實(shí)驗(yàn)設(shè)計(jì)

本文進(jìn)行了多項(xiàng)實(shí)驗(yàn),，以評(píng)估EEGPT在不同EEG任務(wù)中的表現(xiàn),。實(shí)驗(yàn)數(shù)據(jù)集包括多種EEG信號(hào)來(lái)源,，如PhysioMI,、HGD和M3CV等，每個(gè)數(shù)據(jù)集涵蓋了不同的任務(wù)和主題,。實(shí)驗(yàn)評(píng)估了EEGPT在運(yùn)動(dòng)想象分類,、事件相關(guān)電位檢測(cè)和睡眠階段檢測(cè)等任務(wù)上的性能。

1. 數(shù)據(jù)集

預(yù)訓(xùn)練數(shù)據(jù)集包括：

PhysioMI：涉及運(yùn)動(dòng)想象（MI）和運(yùn)動(dòng)執(zhí)行（ME）任務(wù),，共109名受試者,。
HGD：僅涉及運(yùn)動(dòng)想象任務(wù)，共14名受試者,。
TSU：穩(wěn)態(tài)視覺(jué)誘發(fā)范式（SSVEP）數(shù)據(jù)集,，共35名受試者。
SEED：情緒三分類數(shù)據(jù)集,，共15名受試者,。
M3CV：多任務(wù)、多受試者數(shù)據(jù)集,，涵蓋多種EEG任務(wù),，共106名受試者。

下游任務(wù)數(shù)據(jù)集包括：

BCIC-2A/B：與運(yùn)動(dòng)想象相關(guān)的EEG信號(hào)，分別包含10名受試者,。
Sleep-EDFx：睡眠階段檢測(cè)數(shù)據(jù)集,，共197名受試者。
KaggleERN：使用錯(cuò)誤相關(guān)負(fù)波范式,，共26名受試者,。
PhysioP300：使用事件相關(guān)電位P300范式，共9名受試者,。
TUAB：異常檢測(cè)數(shù)據(jù)集,，共2383名受試者。
TUEV：事件類型分類數(shù)據(jù)集,，共288名受試者,。

2. 實(shí)驗(yàn)設(shè)置

模型設(shè)置

EEGPT模型的實(shí)現(xiàn)采用了vision transformer（VIT）結(jié)構(gòu)，設(shè)置了S個(gè)可學(xué)習(xí)的摘要標(biāo)記（類似于分類標(biāo)簽[CLS]標(biāo)記）,，使用58個(gè)電極,，如圖4所示。采樣率為256Hz,，輸入信號(hào)的時(shí)間長(zhǎng)度為1024,。每個(gè)patch的時(shí)間長(zhǎng)度為64，對(duì)應(yīng)250ms的時(shí)間窗口,。訓(xùn)練時(shí)對(duì)50%的時(shí)間維度和80%的通道維度進(jìn)行掩碼遮掩,。

預(yù)訓(xùn)練策略

對(duì)于每個(gè)預(yù)訓(xùn)練數(shù)據(jù)集隨機(jī)抽取10%的樣本作為驗(yàn)證集。如表6所示,，訓(xùn)練了8個(gè)不同編碼長(zhǎng)度,、模型層數(shù)、摘要標(biāo)記的變體,。訓(xùn)練過(guò)程中,，使用AdamW優(yōu)化器，采用OneCycle學(xué)習(xí)率策略（初始學(xué)習(xí)率為2.5e-4,，最大學(xué)習(xí)率為5e-4,，最小學(xué)習(xí)率為3.13e-5），訓(xùn)練200輪次,，在8張Nvidia 3090 GPU上進(jìn)行64和16位混合精度訓(xùn)練,。

評(píng)估策略

對(duì)于TUAB和TUEV數(shù)據(jù)集的分割，遵循于BIOT模型的策略,。其余數(shù)據(jù)集使用留一法（Leave-One-Subject-Out, LOSO）進(jìn)行驗(yàn)證,，其中Sleep-EDFx遵循6:2:2的分割比例并使用十折交叉驗(yàn)證，KaggleERN使用四折交叉驗(yàn)證,，并對(duì)下游任務(wù)使用線性探測(cè)方法,。例如在睡眠階段檢測(cè)任務(wù)中,，使用4層transformer編碼器模型作為分類器，每0.25s輸出一次模型結(jié)果,，以處理30s的長(zhǎng)任務(wù),。為保證實(shí)驗(yàn)可靠性，將每個(gè)實(shí)驗(yàn)重復(fù)三次并計(jì)算標(biāo)準(zhǔn)偏差,。

基線指標(biāo)

對(duì)于TUAB和TUEV數(shù)據(jù)集,，使用來(lái)自BIOT模型的相同基線。在其它任務(wù)中,，使用預(yù)訓(xùn)練的BENDR,、BIOT和LaBraM作為基線。以下指標(biāo)用于比較：平衡準(zhǔn)確率（Balanced Accuracy, BAC）,、AUC-ROC曲線下面積（AUROC）,、加權(quán)F1、科恩卡帕系數(shù)（Cohen’s Kappa）,，其中AUROC用于二分類任務(wù),，加權(quán)F1僅用于多分類任務(wù)。

結(jié)果分析

實(shí)驗(yàn)結(jié)果表明,，EEGPT在多個(gè)數(shù)據(jù)集上的表現(xiàn)均優(yōu)于現(xiàn)有基線模型,。結(jié)果如表2、表3所示,，在TUAB數(shù)據(jù)集上,，EEGPT的性能與BIOT模型相當(dāng)，在TUEV數(shù)據(jù)集上,，EEGPT比BIOT模型提高了9.5%的平衡準(zhǔn)確率,，加權(quán)F1提高了6.9%。

同時(shí)也在其他下游任務(wù)數(shù)據(jù)集上與BENDR,、LaBraM進(jìn)行了比較實(shí)驗(yàn),，結(jié)果如表4所示,，EEGPT的性能也顯著優(yōu)于其他模型,，證明了其在多任務(wù)EEG信號(hào)處理中的有效性。在所有任務(wù)上,，EEGPT模型與BENDR,、BIOT和LaBraM相比都取得了具有競(jìng)爭(zhēng)力的結(jié)果。這表明EEGPT在時(shí)空維度上學(xué)習(xí)了一致的表征特征,，使得該模型能夠更廣泛地應(yīng)用于多種范式任務(wù),，實(shí)現(xiàn)更好的分類性能。

結(jié)論

EEGPT通過(guò)創(chuàng)新的雙自監(jiān)督學(xué)習(xí)方法和時(shí)空表示對(duì)齊技術(shù),，顯著提升了EEG信號(hào)的特征提取能力,。該模型是具有1000多萬(wàn)個(gè)參數(shù)的自監(jiān)督EEG預(yù)訓(xùn)練Transformer模型,，能夠用于學(xué)習(xí)通用的EEG特征，通過(guò)采用雙自監(jiān)督方法進(jìn)行預(yù)訓(xùn)練（包括時(shí)空表示對(duì)齊和基于掩碼的重建）,。時(shí)空表示對(duì)齊將是否使用掩碼的特征patch進(jìn)行對(duì)齊,，提高了EEG表征的質(zhì)量?；谘诖a的重建是利用EEG信號(hào)所表現(xiàn)出的空間和時(shí)間一致性,，在兩個(gè)維度上提取互補(bǔ)特征，通過(guò)層次結(jié)構(gòu)首先從短期EEG信號(hào)中提取穩(wěn)定的空間表示,，再捕獲長(zhǎng)期EEG信號(hào)之間的時(shí)間相關(guān)性,。實(shí)驗(yàn)結(jié)果驗(yàn)證了其在運(yùn)動(dòng)想象、睡眠階段檢測(cè)和ERP類型分類等多種下游任務(wù)中的優(yōu)越表現(xiàn),，展示了其廣泛的應(yīng)用前景和潛力,，為生物信號(hào)處理和人工智能應(yīng)用提供了新的解決方案。未來(lái)的研究可以進(jìn)一步探索EEGPT在更復(fù)雜的腦機(jī)接口和神經(jīng)科學(xué)研究中的潛在應(yīng)用,。

附錄：近2年腦電信號(hào)大模型的相關(guān)論文對(duì)比

（需要的話可以在下方對(duì)應(yīng)論文,，加上我們的往期推文鏈接）

《Large Brain Model for Learning Generic Representations with Tremendous EEG Data in BCI》：受大語(yǔ)言模型的啟發(fā)，提出了一個(gè)名為大腦大模型（LaBraM）的統(tǒng)一 EEG 基礎(chǔ)模型,，旨在從大量EEG數(shù)據(jù)中學(xué)習(xí)通用特征表示,。模型通過(guò)分割 EEG 信號(hào)為通道補(bǔ)丁和向量量化神經(jīng)頻譜預(yù)測(cè)，能夠有效處理不同電極配置和信號(hào)長(zhǎng)度,。在來(lái)自約 20 個(gè)數(shù)據(jù)集的大約 2500 小時(shí)的各種類型的 EEG 信號(hào)上進(jìn)行預(yù)訓(xùn)練,，能處理不同電極配置和長(zhǎng)度的 EEG 數(shù)據(jù)。

《NEUROLM: A UNIVERSAL MULTI-TASK FOUNDATION MODEL FOR BRIDGING THE GAP BETWEEN LANGUAGE AND EEG SIGNALS》：提出多任務(wù)基礎(chǔ)模型NeuroLM,，旨在整合語(yǔ)言和EEG信號(hào),，以提高情感識(shí)別和認(rèn)知狀態(tài)分析的準(zhǔn)確性，將 EEG 信號(hào)視為外語(yǔ),，融入大語(yǔ)言模型框架,。通過(guò)文本對(duì)齊的神經(jīng)標(biāo)記器編碼EEG信號(hào)、多通道自回歸預(yù)訓(xùn)練和多任務(wù)指令調(diào)整,，實(shí)現(xiàn)多任務(wù)學(xué)習(xí)和推理,。

《FoME: A Foundation Model for EEG using Adaptive Temporal-Lateral Attention Scaling》：提出 FoME （腦電圖基礎(chǔ)模型），開(kāi)創(chuàng)性地采用時(shí)間-頻率融合嵌入技術(shù)和自適應(yīng)時(shí)間-橫向注意力縮放（ATLAS）機(jī)制處理EEG信號(hào),，捕捉其復(fù)雜的時(shí)空動(dòng)態(tài),，適應(yīng)不同數(shù)據(jù)集，并結(jié)合CNN和Transformer增強(qiáng)了對(duì)局部和全局特征的學(xué)習(xí)能力,，促進(jìn)穩(wěn)健的多通道建模,。

《Brant - X: A Unified Physiological Signal Alignment Framework》：提出Brant - X模型，用于對(duì) EEG 與其他生理信號(hào)之間的相關(guān)性進(jìn)行建模,，解決了多種生理信號(hào)間對(duì)齊的問(wèn)題,。利用 EEG 基礎(chǔ)模型,，通過(guò)兩級(jí)對(duì)齊策略（補(bǔ)丁級(jí)和序列級(jí)）分別處理局部和整體特征，并引入特征提取和對(duì)齊算法,，有效對(duì)齊 EEG 與其他信號(hào)（EOG,、ECG、EMG）的語(yǔ)義,，以及適應(yīng)多任務(wù)學(xué)習(xí)的方法同時(shí)處理多個(gè)生理信號(hào)任務(wù)以提高性能,。

《EEGPT: Pretrained Transformer for Universal and Reliable Representation of EEG Signals》：提出用于通用 EEG 特征提取的EEGPT 模型，設(shè)計(jì)了雙自監(jiān)督學(xué)習(xí)方法,，結(jié)合時(shí)空表示對(duì)齊和掩碼重建,，提高特征質(zhì)量和模型收斂性，為 EEG 信號(hào)處理提供有效的創(chuàng)新解決方案,。

《EEGPT: Unleashing the Potential of EEG Generalist Foundation Model by Autoregressive Pre-training》：提出自回歸EEG 預(yù)訓(xùn)練模型,，通過(guò)引入電極建模策略、開(kāi)發(fā)自回歸預(yù)訓(xùn)練方法以及實(shí)施帶有可學(xué)習(xí)電極圖網(wǎng)絡(luò)的多任務(wù)遷移學(xué)習(xí)范式,，捕捉了EEG信號(hào)中固有的順序和時(shí)間依賴關(guān)系,。

PPT匯報(bào)鏈接：

https://nips.cc/media/neurips-2024/Slides/93793.pdf

撰稿人：陳宗楠

審稿人：潘家輝

登錄用戶可以查看和發(fā)表評(píng)論，請(qǐng)前往登錄或注冊(cè),。