Machine Learning v Medicíne

Z WikiSkript

Umelá inteligencia (AI) má v modernom svete mnohé užitočné aplikácie. Machine learning (ML) je vetvou AI, ktorá stojí na pilieroch informatiky, štatistiky a matematickej optimalizácie. ML je v jednoduchosti proces, v ktorom dodávame počítačovému programu veľké množstvo dát, pričom použitím komplexných matematických operácii program zlepšuje svoju analýzu týchto dát a tým aj svoje predpovede.

Ako to funguje?[upravit | editovat zdroj]

Štruktúra neurónovej siete

Typy ML algoritmov sú rôzne v závislosti od princípu fungovania a problémov ktoré majú riešiť. V medicíne hrajú veľmi dôležitú úlohu deep learning algoritmy používané na umelé neurónové siete.

Umelá neurónová sieť je systém čiastočne inšpirovaný prírodou, v ktorej neuróny fyzicky komunikujú a vytvárajú široko poprepájané siete. Ak sú neuróny v ľudskom mozgu aktivované v určitom vzore, spúšťajú napríklad procesy učenia, rozpoznávania okolia, vyhodnocovanie nebezpečenstva, či reakciu na prítomnosť potenciálneho partnera. Umelá neurónová sieť sa dokáže rovnako učiť tým, že analyzuje dáta všeobecne bez toho, aby na to bola vopred naprogramovaná (unsupervised learning).

Neurónová sieť je zložená z umelých neurónov, ktoré sú poprepájané edgmi. Signál, ktorý neurón príjme od iného neurónu je reálne číslo, ktoré následne tento neurón nelineárne spracuje spolu s ostatnými signálmi, ktoré dostal od iných neurónov cez aktivačnú funkciu. V procese učenia, sa toto spracovanie mení a ovplyvňuje (zvyšuje alebo znižuje) silu signálu v spojení. Tento faktor nazývame weight - váha. Neuróny môžu mať nastavený takzvaný threshold, vďaka ktorému odošlú signál len v prípade, že boli dostatočne “stimulované”.

Neuróny v sieti sú usporiadané do vrstiev, z ktorých každá vykonáva inú transformáciu resp. analýzu na vložených dátach. Prvá vrstva sa nazýva input layer a posledná output layer. V prípade, že medzi input a output layer sa nachádza niekoľko skrytých vrstiev, v ktorých nevieme ako presne sú informácie vložené do programu spracované, hovoríme o Deep Learningu.

Medicína je vysoko perspektívna budúcnosť pre využitie deep learningových algoritmov prostredníctvom takzvaného Pattern Recognition - teda rozpoznávania vzorov na obrázkoch. V tomto prípade je program schopný rozpoznať podobnosti na obrázkoch v obrovských data setoch a klasifikovať ich do kategórii. Aby sme nehovorili len takto abstraktne, tak práve toto je proces, ktorý dokáže na RTG, MRI alebo USG snímku rozpoznať rakovinu v štádiách, kedy by bola jednoducho prehliadnuteľná doktorom. To, ako sa program naučil rozpoznať rakovinu na snímke nevieme zistiť a neurónovú sieť preto nazývame black box.

Poďme sa teda pozrieť na jednotlivé aplikácie deep learningu v medicíne.

Histopatológia[1][upravit | editovat zdroj]

Karcinóm pľúc je hlavnou príčinou úmrtí na rakovinu u mužov aj žien v USA a západnom svete. Je klasifikovaný na malobunkový neuroendokrinný karcinóm a nemalobunkový karcinóm, ktorého adenokarcinóm je najbežnejším histologickým typom, čo predstavuje asi polovicu všetkých prípadov.

Klasifikácia histologických preparátov pri identifikácii pľúcnych adenokarcniómov je kritická pre určenie stupňa rozsahu a správnej liečby pre pacienta. Táto úloha je často neľahká vďaka odlišnostiam medzi nádormi a subjektívnym kritériám hodnotiaceho doktora. Vo vedeckej štúdii bol navrhnutý deep learningový model, ktorý automaticky klasifikuje vzory (patterns) vo vzorkách z pacientov s pľúcnym adenokarcinómom. Model používa konvolučnú neurónovú sieť na identifikáciu regiónov neoplastických buniek, na základe ktorých vie odhadnúť, či ide o vzorku, ktorá má v sebe isté vzory napovedajúce výskytu rakoviny.

Zjednodušený proces analýzy jednotlivých malých kúskov vzorky a ich klasifikácia.[1]
Vizualizácia vzorov v preparátoch poznačených patológom (A.i–iv) a vzorov detekovaných deep learningovým modelom(B.i–iv).[1]

Výsledok[upravit | editovat zdroj]

Model bol hodnotený na nezávislej sade 143 obrázkov. Dosiahol skóre kappa* 0,525 a zhodu 66,6% s tromi patológmi pre klasifikáciu prevládajúcich vzorov. Všetky hodnotiace metriky pre skúmaný model a troch patológov boli v 95% intervaloch spoľahlivosti. Ak sa model podarí previezť do klinickej praxe, tak môže výrazne pomôcť patológom pri zlepšovaní klasifikácie pľúcnych adenokarcinómov automatickým predbežným skríningom a zvýrazňovaním rakovinových oblastí.

*Skóre Kappa je veľmi zjednodušene meradlo toho, ako presne sa prípady klasifikované ML klasifikátorom zhodovali s "ground truth" - realitou. Neexistuje nejaká univerzálna interpretácia jeho hodnoty, no podľa článku z Wikipédie, Landis a Koch považujú 0-0.20 ako veľmi slabé, 0.21-0.40 ako slabé, 0.41-0.60 ako primerané, 0.61-0.80 ako veľmi dobré a 0.81-1 ako takmer perfektné.

Detekcia nádorov na mozgu [2][upravit | editovat zdroj]

Automatická segmentácia nádorov na mozgu z obrázkov MRI je potenciálny spôsob, ako by sme v budúcnosti mohli pomocť lekárom lepšie identifikovať rakovinu. Konvolučné neurónové siete (CNN) sú potenciálne pre tieto úlohy ako vyšité.

Autori čllánku vybrali 44 pacientov s glioblastómom (GBM), ktorí mali k dispozícii predoperačné údaje (MRI) a tiež údaje o prežití, z dvoch inštitúcií zo súboru údajov The Cancer Imaging Archive. Obrázky boli manuálne anotované naznačením každej nádorovej zložky, aby sa vytvorila základná pravda (ground truth). Aby automaticky rozdelili nádory u každého pacienta, vyškolili tri CNN: (a) jeden s použitím údajov o pacientoch z tej istej inštitúcie ako údaje z testov, (b) jeden s použitím údajov o pacientoch z inej inštitúcie a (c) s použitím údajov o pacientoch z oboch inštitúcií. Ďalej opomenieme len výsledky zohľadňujúce presnosť algoritmu, bez zamerania sa na odchýlky roznych inštitúcií.

Vizuálna interpretácia klasifikácie MRI snímkov neurónovou sieťou. Zaujímavé je porovnanie výsledkov 3. a 4. stĺpca - trained on both institutions vs. ground truth.

Dice coefficient sa bežne používa pre porovnávanie výsledkov z algoritmov proti skutočnému hodnoteniu špecialistu. Pre model trénovaný na oboch inštitúciách je priemerný dice coefficient 0.75 ± 0.13 pre Class 2 (na obrázku zelený región). Tieto výsledky môžeme považovať za veľmi dobré, a tešiť sa na potenciálne aplikácie týchto algoritmov v medicínskej praxi.

Medical Sieve od IBM[upravit | editovat zdroj]

...alebo novinky, o ktorých sa oplatí vedieť.[upravit | editovat zdroj]
Ukážka prostredia programu.

S rastom zobrazovacích metód ake je MRI, CT a ultrazvuk, musia rádiológovia a kardiológovia skúmať veľké množstvo snímkov a záznamov na dennej báze. Medical Sieve, IBM Research Grand Challenge, ktorý vedie Dr. Tanveer Syeda-Mahmood (stf@us.ibm.com), sa zameriava na vývoj kognitívneho asistentského systému pre rádiológov a kardiológov, ktorý funguje rýchlo zisťuje anomálie. Jeho veľkou výzvou je vybudovať preukázateľne dobrého kognitívneho klinického asistenta s rovnakou schopnosťou ako rádiológ na základnej úrovni, ktorý pomôže rádiológom s presnosťou a účinnosťou určiť štruktúry, na ktoré sa pozerajú.

Zoznam referencií[upravit | editovat zdroj]

  1. a b c Wei, J.W., Tafe, L.J., Linnik, Y.A. et al. Pathologist-level classification of histologic patterns on resected lung adenocarcinoma slides with deep neural networks. Sci Rep 9, 3358 (2019) doi:10.1038/s41598-019-40041-7
  2. AlBadawy, E. A., Saha, A. and Mazurowski, M. A. (2018), Deep learning for segmentation of brain tumors: Impact of cross‐institutional training and testing. Med. Phys., 45: 1150-1158. doi:10.1002/mp.12752


  1. Ad: ďalšie referencie sú uvedené pri daných témach ako odkazy
  2. Ad: všetky obrázky pochádzajú z uvedených zdrojov a odkazov, autorské práva neporušené