AgentMD

Z WikiSkript

AgentMD je experimentální systém AI agenta, který automatizuje vyhledání, vytvoření a použití klinických kalkulátorů pro predikci rizik. Byl vyvinut týmem National Library of Medicine (NIH, USA) a publikován v říjnu 2025 v časopise Nature Communications.[1]

Pozadí a motivace[upravit | editovat zdroj]

Klinické kalkulátory (skórovací systémy) podporují odhad rizika a klinické rozhodování (např. HEART pro odhad kardiálního rizika nebo CURB-65 u pneumonie). V rutinní praxi však jejich používání naráží na několik bariér: je nutné vědět, který kalkulátor zvolit a kdy, často chybí dobrá integrace do elektronické zdravotnické dokumentace (EHR) a manuální zadávání údajů je časově náročné a chybové. Šíření nových kalkulátorů do praxe navíc bývá pomalé.

Velké jazykové modely a na nich postavení AI agenti mohou část těchto kroků automatizovat (výběr vhodného nástroje, extrakce vstupů z textu, spuštění výpočtu a srozumitelné shrnutí výsledku).

Popis systému AgentMD[upravit | editovat zdroj]

AgentMD je navržen ve dvou komplementárních rolích: jako tvůrce nástrojů (tool builder) a uživatel nástrojů (tool user). Architektura je popisována jako nezávislá na konkrétním LLM (LLM-agnostic).[1]

Tvůrce nástrojů (tool builder)[upravit | editovat zdroj]

V roli tvůrce nástrojů AgentMD prochází databázi PubMed a identifikuje publikace popisující klinické kalkulátory. Z textu publikace následně:

  1. extrahuje strukturu kalkulátoru, vstupní proměnné a interpretaci výsledků,
  2. generuje spustitelnou implementaci (např. funkci v Pythonu),
  3. provede automatizovanou kontrolu kvality a jednotkové testy (unit tests).[1]

Výstupem je knihovna RiskCalcs obsahující 2 164 spustitelných klinických kalkulátorů napříč medicínskými obory.[1]

Uživatel nástrojů (tool user)[upravit | editovat zdroj]

V roli uživatele nástrojů AgentMD při zadaném klinickém scénáři (např. text příjmové zprávy) typicky:

  1. vybere relevantní kalkulátory z knihovny RiskCalcs,
  2. extrahuje požadované vstupní parametry z klinického textu,
  3. provede výpočet a vytvoří interpretaci výsledku,
  4. připraví shrnutí pro klinika nebo pro analytické účely.[1]

Výsledky hodnocení[upravit | editovat zdroj]

Kvalita knihovny RiskCalcs[upravit | editovat zdroj]

Manuální hodnocení (anotátoři, dva vzorky – 50 nejcitovanějších a 50 náhodně vybraných kalkulátorů) uvádí:

  • přesnost kontroly kvality >85 %,
  • úspěšnost jednotkových testů >90 %.[1]

Benchmark RiskQA[upravit | editovat zdroj]

Pro hodnocení výběru a aplikace kalkulátorů byl sestaven dataset RiskQA (350 úloh s výběrem odpovědí). Autoři porovnávají AgentMD s baseline založenou na GPT-4 bez agentního rámce a bez přístupu ke knihovně kalkulátorů (promptování typu chain-of-thought).[1][2]

Model Přesnost (accuracy)
AgentMD 87,7 %
GPT-4 (bez agentního rámce, bez RiskCalcs) 40,9 %

Validace na reálných datech[upravit | editovat zdroj]

Autoři dále hodnotí použitelnost na klinických poznámkách (extrakce vstupů, výpočet a sumarizace výsledků) ve dvou datasetech:[1]

Datová sada Popis Příklad typu úlohy
Yale Medicine ED notes 698 příjmových poznámek z urgentního příjmu Individuální predikce rizik ve vybraných scénářích
MIMIC-III 9 822 příjmových poznámek z JIP/ICU Populační analýzy (agregované charakteristiky a rizika)

Bezpečnost a klinické použití[upravit | editovat zdroj]

AgentMD je popsaný jako výzkumný rámec a jeho výsledky nelze bez dalšího považovat za podklad pro autonomní klinické rozhodování. I při správném výběru kalkulátoru může dojít k chybám při extrakci vstupních proměnných z volného textu, při mapování proměnných na definice z publikace nebo při interpretaci výstupu v kontextu konkrétního pacienta.[1]

Pro praktické nasazení je proto nutná:

  • další klinická validace v širších a heterogenních souborech,
  • testování robustnosti (chybějící/atypické vstupy, neúplná dokumentace),
  • bezpečné zapojení do pracovních postupů a EHR,
  • jasné vymezení odpovědnosti a etických pravidel při použití AI v klinickém prostředí.[1]

Mini-kazustika (ilustrační příklad)[upravit | editovat zdroj]

Hypotetický scénář: pacient přijat s podezřením na komunitní pneumonii; v textu příjmu jsou uvedeny např. věk, dechová frekvence, krevní tlak, stav vědomí a laboratorní údaj o uree.

Možný postup v rámci AgentMD:

  1. Agent z klinického textu rozpozná, že je vhodné použít např. CURB-65 (pokud jsou dostupné vstupy).
  2. Z textu vytěží potřebné proměnné (nebo označí chybějící hodnoty).
  3. Spustí výpočet skóre a vrátí výsledek společně s přehledem použitých vstupů a interpretací skóre dle definice kalkulátoru.
  4. Upozorní na nejistoty (chybějící/nejednoznačné údaje) a nutnost klinické kontroly.

Tento příklad ukazuje princip „tool-augmented AI“, tj. orchestraci formálně definovaného nástroje (kalkulátoru) jazykovým modelem, nikoli nahrazení klinického úsudku.

Význam pro medicínskou informatiku a vzdělávání[upravit | editovat zdroj]

AgentMD je příkladem přístupu tool-augmented AI, kdy LLM neplní jen roli generátoru textu, ale koordinuje použití specializovaných nástrojů (zde klinických kalkulátorů). To je relevantní zejména v kontextu:

  • klinické podpory rozhodování (CDS),
  • automatizace práce s EHR,
  • tzv. „ambient AI“ a AI scribů (zpracování klinické dokumentace),
  • výuky práce s klinickými skórovacími systémy.

Dostupnost (článek, kód)[upravit | editovat zdroj]

Publikace je dostupná jako open access a je licencována pod Creative Commons Attribution 4.0 (CC BY 4.0).[1] Implementace a doprovodné materiály jsou dostupné v repozitáři NCBI-NLP na GitHubu.[3]

Reference[upravit | editovat zdroj]

  1. a b c d e f g h i j k JIN, Q, Z WANG a Y YANG. AgentMD: Empowering language agents for risk prediction with large-scale clinical tool learning. Nature Communications [online]. 2025, roč. 16, no. -, s. 9377, dostupné také z <https://www.nature.com/articles/s41467-025-64430-x>. PMID: -.DOI: 10.1038/s41467-025-64430-x.
  2. Jin Q et al.. AgentMD: Empowering Language Agents for Risk Prediction with Large-Scale Clinical Tool Learning (arXiv:2402.13225) [online]. arXiv, [cit. 2026-06-07]. <https://arxiv.org/abs/2402.13225>.
  3. NCBI-NLP. ncbi-nlp/Clinical-Tool-Learning [online]. GitHub, [cit. 2026-06-07]. <https://github.com/ncbi-nlp/Clinical-Tool-Learning>.

Externí odkazy[upravit | editovat zdroj]