7 tipp a biosignál előfeldolgozásához: hogyan javíthatjuk a Deep Learning osztályozó robusztusságát

Miért olyan fontos a zajok és torzulások kezelése?

Általában bármilyen, a bioiosignálokkal kapcsolatos osztályozási feladat (rendellenesség észlelése), például elektrokardiográfia (EKG), elektroencefalográfia (EEG), elektromiográfia (EMG) stb. Tekinthető idősoros felismerési problémának.

Karush – Kuhn – Tucker körülmények szerint a bemeneti jeleknek meg kell felelniük az állóképesség kritériumának. Egyszerűen: a bemenő jelek mintáinak azonosaknak vagy hasonlóaknak kell lenniük, mint az edzőkészletben, anélkül, hogy a jel eloszlása ​​idővel megváltozik.

A biosignálok bármilyen felvételét általában sok hang okozza. Ezek a torzulások további varianciát vezetnek be a modellbe, mivel megsértik az állóképességi kritériumokat.

Ezeknek a zajoknak eltérő lehet a természete, és pontosabb információkat találhat itt és itt. Ezek a cikkek leírják az EKG-zajokat, de alkalmazhatók bármilyen biojelre is.

Ez azt jelenti, hogy a DL osztályozó teljes teljesítményét az előfeldolgozási technikák hatékonysága határozza meg.

Vessen egy pillantást arra, hogyan lehet gyakorlatilag javítani a mély tanulási modell robusztusságát az előfeldolgozással.

1. A hatékony digitális jelfeldolgozás 50% -a a hatékony analóg feldolgozás

A digitális jelfeldolgozás a hatékony analóg jelfeldolgozással kezdődik. A leggyakoribb hiba az alias problémával kapcsolatos.

A Nyquist tétel szerint az ADC mintavételi frekvenciájának kétszer nagyobbnak kell lennie, mint a bemeneti jel legmagasabb frekvenciája. Bármely jel nem felel meg ennek a kritériumnak az álnévnek a fő frekvenciatartományba, és eltakarja a hasznos jelzést további zajként:

A probléma elkerülése érdekében az analóg aluláteresztő szűrőt alkalmazzák az ADC előtt. A hardvermérnökök nagyon gyakran úgy gondolják, hogy az egyszerű RC-áramkör elegendő erre a célra. Ugyanakkor óriási különbség van a tökéletes aluláteresztő szűrő és a valódi frekvenciaválasz között:

Az ideális (bal) és a valós (bal) analóg szűrők frekvenciajellemzőjéből áll

Győződjön meg arról, hogy az Aliasing LPF eleget tesz a Nyquist frekvencia elnyomásának követelményeinek (További részletekhez ezt a könyvet ajánlom):

  • 50dB 8 bites ADC-hez
  • 62dB 10 bites ADC-hez
  • 74dB 12 bites ADC-hez
  • 98dB 16 bites ADC-hez

2. Használjon ugyanazt a hardvert az edzéshez és az előrejelzésekhez

Különböző eszközök határozzák meg a különböző jel rögzítési körülményeket, például az elektronika nemlineáris torzulását, a különféle burkolatot, az érzékelők eltérő helyzetét stb.

Mivel a különböző körülmények határozzák meg a különböző jeleket, azt javasolom, hogy ugyanazt a hardvert használják a modellezéshez és az előrejelzések készítéséhez. Ennek oka lehet az edzéskészlet további elfogultsága.

Ha nincs lehetőség, akkor kipróbálhatja az oktatókészlet torzítását, de ehhez további ismeretekre van szükség a hardver és a zajtartomány területén.

3. Nyquist tétel a képzés felgyorsításához

Mint fentebb leírtuk, a Nyquist tétel meghatározza az ADC minimális mintavételi sebességét, hogy az analóg jel információjának 100% -át megtakarítsa az átalakítás után. Ez azt jelenti, hogy ha a jel maximális frekvenciája alacsonyabb, mint Fs / 2, akkor van redundáns, amely felhasználható a mélyhálózat edzésének felgyorsítására.

Vegyünk egy példát.

Van egy ECG jel 125 Hz mintavételi frekvenciával, amelyet a Physionet adatbázis biztosít (30 Hz szűrőt alkalmaztak):

Tipp az EKG előfeldolgozásához: Az EKG jelek 0–100 Hz-t allokálnak, de a 30Hz aluláteresztő szűrő alkalmazható. Tartja érintetlenül a P- és a T-hullámokat, de az R csúcs amplitúdóját 20-30% -kal csökkenti. Nem kritikus a rendellenességek és a pulzusszám-szám felismerése szempontjából.

A jel teljesítmény-spektrum sűrűsége így néz ki:

Mint fentebb látható, a jel energiájának fő része 0–30 Hz között van koncentrálva. Csökkenjük 80Hz-re, és hasonlítsuk össze az eredeti jelzéssel:

A decimálási hatás bemutatása: jel 80Hz (felső) és 125Hz (alsó) mintavételi sebességgel

Az eredeti formát megtartják, de a jel teljes hossza 35% -kal csökken, 92-ről 59-re. Ez megegyezik az edzés 35% -os gyorsulásával, a pontosság elvesztése nélkül.

Ennek a megközelítésnek a hatékonyságát a Github projektben mutatom be.

Fontos megjegyzés: Ügyeljen arra, hogy a decimáció ne veszítsen el további részleteket, amelyeket fel lehet használni a felismeréshez. A kísérlet az egyetlen módja annak igazolására. De gyakorlatilag két halmozott (CNN + LSTM) modell képzése alulmintavételezett jeleken általában gyorsabb, mint az egyik modellnek az eredeti mintavételi gyakorisággal történő edzése a teljesítmény elvesztése nélkül.

4. Ismerje meg a rendszerre vonatkozó követelményeket

Mielőtt bonyolultabb szűrési algoritmusokat próbálna ki, mint például a Wavelette vagy az adaptív, javaslom megérteni, hogy milyen szolgáltatások szükségesek a felismeréshez.

Íme egy példa.

Fontolja meg a mély tanulási modell feladatát az aritmia észlelése járás közben. Az EKG séta adatai általában alacsony frekvenciájú zajt tartalmaznak:

Eközben a tiszta EKG jel így néz ki:

A P- és a T-hullámok el vannak maszkolva, és a kinyerés meglehetősen nem triviális feladat. Mielőtt összetett algoritmusokat dolgoznánk ki, nézzük meg, mi az aritmia:

Az aritmia észleléséhez csak az impulzusszámlálás elegendő a hatékony detektor felépítéséhez, de nyilvánvalóan az alacsony frekvenciájú alapvonal-vándorlás egy további változatot vezet be, megsértve az állóképességet.

Az EKG különböző részei eltérő spektrumtartományokat oszthatnak ki:

Egyszerűen egy egyszerű 5–15 Hz-es sávszűrő oldja meg az extraháló R-csúcsok kérdését. E szűrő alkalmazásával elnyomják a P és a T hullámokat (és a hozzájuk kapcsolódó rendellenességek nem állnak rendelkezésre felismerésre), de a rendszerre vonatkozó követelmények teljesülnek.

Fő szabály: minél több algoritmus bonyolult, minél kevésbé robusztus, és több erőforrást igényel a végrehajtáshoz (idő és pénz). A legegyszerűbb digitális szűrést kell először próbálnia.

5. Használja a MiniMax elvét a csővezetékek fejlesztéséhez

A MiniMax elv a játék elméletének nagyszerű stratégiája.

A biosignálokkal kapcsolatos fő probléma a jelek minőségének időbeli változása:

  • 1. eset. Kiváló minőségű a téma alacsony aktivitása alatt:
  • 2. eset. Az adatok rossz minősége az intenzív mozgatás során. A P és a T el vannak maszkolva, és nincs mód arra, hogy kivonjuk a zajból egy egycsatornás rendszerrel:

Az első esetben a P, QRS, T kimutatható, ez azt jelenti, hogy a rendellenes EKG minták (szívroham, pitvari fibrilláció stb.) Nagy részét fel lehet ismerni.

A második esetben csak néhány, a QRS-hez kapcsolódó rendellenesség (aritmia stb.) Volt felismerhető.

Mint fentebb látható, a QRS kivonásának legjobb módja az 5–15 Hz-es sávszűrő alkalmazása, eközben a P és a T eltűnik.

A 2. esetnél ez nem lesz kritikus, mivel a P és a T zajt maszkolja, de korlátozza a lehetséges észlelt patológiák mennyiségét, miközben a bemeneten jó minõségû adatok vannak.

A probléma elkerülésének legjobb módja az adaptív szűrő alkalmazása, amely megváltoztatja annak impulzusválaszát a változó környezetre:

Az ötlet egyszerű:

  1. Készítsen detektálót az adatminőségre (lineáris detektorok / CNN);
  2. Adjon meg egy szűrőkészletet;
  3. Készítsen szabályt az impulzus válasz megváltoztatására a bemeneti jel minőségétől függően.

6. A High-Pass szűrők intelligens használata

A kiindulási vándorlás kezeléséhez általában magasáteresztő szűrésre van szükség:

EEG alapjel zajjal

A nyilvánvaló megközelítés fontolóra veszi a felülúszó szűrő alkalmazását. Ennek fő akadálya egy nagyon alacsony határfrekvencia (0,05 Hz) és a magas stop sáv elnyomás (> 30 dB). A követelmények teljesítéséhez a szűrőnek magas rendűnek kell lennie, vagyis hosszú késleltetést jelent, ami valószínűleg nem alkalmas valósidejű alkalmazásokhoz.

Alternatív módszer:

  • A bemeneti jel elvesztése;
  • Az alap zaj kivonása aluláteresztő szűrő alkalmazásával, 0,05 Hz küszöbfrekvenciával;
  • Interpolálja a jelet;
  • Vonjuk le az alapvonalat az eredeti jelből

A kódpélda (Matlab) elérhető ebben a GitHub lerakatban.

7. Iteratív kísérletezés

Mint minden adattudományi probléma, a biosignálok osztályozása ismétlődő kísérleti folyamat, mivel a különböző szűrési megközelítések alkalmasak lehetnek a különböző alkalmazásokra.

Összefoglaltam a szűrési technikák rövid listáját, a legmegbízhatóbból a legrosszabbig.

MEGJEGYZÉS: Csak az én személyes véleményem, nem egyezhet meg a véleményével.

  • Digitális szűrés (FIR, IIR). A FIR a csoport késleltetési torzulások hiánya miatt ajánlott. Közepes teljesítményű, ideális a nem-specifikus körülményekhez, nagyon egyszerű a végrehajtáshoz és 100% -ig robusztus.
  • Hullám szűrés. Erõs teljesítmény, de a megvalósítás bonyolult lehet a paraméterek kiválasztása szempontjából.
  • Adaptív szűrés. Ez a módszer rosszabb teljesítményt mutat, mint a Wavelet szűrés, de sokkal egyszerűbb a jó mozgékonyságú és teljesítményű megvalósításhoz.
  • Független alkotóelem-analízis (ICA) / Blind Source Separation (BSS). A gyors ICA algoritmus legelterjedtebb programozási nyelveken elérhető itt. Azt javaslom, hogy próbálja meg utoljára, mert:
  1. Csak többcsatornás konfigurációkkal működik;
  2. Nagyon gyengenek találtam ennek a megközelítésnek a robusztusságát, mivel a konvergencia nem garantált;
  3. Relatíve több számítási erőforrást igényel, valószínűleg nem alkalmas valósidejű alkalmazásokhoz.

___________________________________________________________________

Hasznosnak találta a papírt? Kérjük, hagyja meg véleményét a cikkről ezen a linken

___________________________________________________________________

Dmitrii Shubin, kutatás-fejlesztési mérnök, orvostechnikai eszközök

Toronto, ON, Kanada

Elérhetőségei:

E-mail: shubin.dmitrii.n@gmail.com

LinkedIn, GitHub