AgentMD
AgentMD je experimentální systém AI agenta, který automatizuje vyhledání, vytvoření a použití klinických kalkulátorů pro predikci rizik. Byl vyvinut týmem National Library of Medicine (NIH, USA) a publikován v říjnu 2025 v časopise Nature Communications.[1]
Pozadí a motivace[upravit | editovat zdroj]
Klinické kalkulátory (skórovací systémy) podporují odhad rizika a klinické rozhodování (např. HEART pro odhad kardiálního rizika nebo CURB-65 u pneumonie). V rutinní praxi však jejich používání naráží na několik bariér: je nutné vědět, který kalkulátor zvolit a kdy, často chybí dobrá integrace do elektronické zdravotnické dokumentace (EHR) a manuální zadávání údajů je časově náročné a chybové. Šíření nových kalkulátorů do praxe navíc bývá pomalé.
Velké jazykové modely a na nich postavení AI agenti mohou část těchto kroků automatizovat (výběr vhodného nástroje, extrakce vstupů z textu, spuštění výpočtu a srozumitelné shrnutí výsledku).
Popis systému AgentMD[upravit | editovat zdroj]
AgentMD je navržen ve dvou komplementárních rolích: jako tvůrce nástrojů (tool builder) a uživatel nástrojů (tool user). Architektura je popisována jako nezávislá na konkrétním LLM (LLM-agnostic).[1]
Tvůrce nástrojů (tool builder)[upravit | editovat zdroj]
V roli tvůrce nástrojů AgentMD prochází databázi PubMed a identifikuje publikace popisující klinické kalkulátory. Z textu publikace následně:
- extrahuje strukturu kalkulátoru, vstupní proměnné a interpretaci výsledků,
- generuje spustitelnou implementaci (např. funkci v Pythonu),
- provede automatizovanou kontrolu kvality a jednotkové testy (unit tests).[1]
Výstupem je knihovna RiskCalcs obsahující 2 164 spustitelných klinických kalkulátorů napříč medicínskými obory.[1]
Uživatel nástrojů (tool user)[upravit | editovat zdroj]
V roli uživatele nástrojů AgentMD při zadaném klinickém scénáři (např. text příjmové zprávy) typicky:
- vybere relevantní kalkulátory z knihovny RiskCalcs,
- extrahuje požadované vstupní parametry z klinického textu,
- provede výpočet a vytvoří interpretaci výsledku,
- připraví shrnutí pro klinika nebo pro analytické účely.[1]
Výsledky hodnocení[upravit | editovat zdroj]
Kvalita knihovny RiskCalcs[upravit | editovat zdroj]
Manuální hodnocení (anotátoři, dva vzorky – 50 nejcitovanějších a 50 náhodně vybraných kalkulátorů) uvádí:
- přesnost kontroly kvality >85 %,
- úspěšnost jednotkových testů >90 %.[1]
Benchmark RiskQA[upravit | editovat zdroj]
Pro hodnocení výběru a aplikace kalkulátorů byl sestaven dataset RiskQA (350 úloh s výběrem odpovědí). Autoři porovnávají AgentMD s baseline založenou na GPT-4 bez agentního rámce a bez přístupu ke knihovně kalkulátorů (promptování typu chain-of-thought).[1][2]
| Model | Přesnost (accuracy) |
|---|---|
| AgentMD | 87,7 % |
| GPT-4 (bez agentního rámce, bez RiskCalcs) | 40,9 % |
Validace na reálných datech[upravit | editovat zdroj]
Autoři dále hodnotí použitelnost na klinických poznámkách (extrakce vstupů, výpočet a sumarizace výsledků) ve dvou datasetech:[1]
| Datová sada | Popis | Příklad typu úlohy |
|---|---|---|
| Yale Medicine ED notes | 698 příjmových poznámek z urgentního příjmu | Individuální predikce rizik ve vybraných scénářích |
| MIMIC-III | 9 822 příjmových poznámek z JIP/ICU | Populační analýzy (agregované charakteristiky a rizika) |
Bezpečnost a klinické použití[upravit | editovat zdroj]
AgentMD je popsaný jako výzkumný rámec a jeho výsledky nelze bez dalšího považovat za podklad pro autonomní klinické rozhodování. I při správném výběru kalkulátoru může dojít k chybám při extrakci vstupních proměnných z volného textu, při mapování proměnných na definice z publikace nebo při interpretaci výstupu v kontextu konkrétního pacienta.[1]
Pro praktické nasazení je proto nutná:
- další klinická validace v širších a heterogenních souborech,
- testování robustnosti (chybějící/atypické vstupy, neúplná dokumentace),
- bezpečné zapojení do pracovních postupů a EHR,
- jasné vymezení odpovědnosti a etických pravidel při použití AI v klinickém prostředí.[1]
Mini-kazustika (ilustrační příklad)[upravit | editovat zdroj]
Hypotetický scénář: pacient přijat s podezřením na komunitní pneumonii; v textu příjmu jsou uvedeny např. věk, dechová frekvence, krevní tlak, stav vědomí a laboratorní údaj o uree.
Možný postup v rámci AgentMD:
- Agent z klinického textu rozpozná, že je vhodné použít např. CURB-65 (pokud jsou dostupné vstupy).
- Z textu vytěží potřebné proměnné (nebo označí chybějící hodnoty).
- Spustí výpočet skóre a vrátí výsledek společně s přehledem použitých vstupů a interpretací skóre dle definice kalkulátoru.
- Upozorní na nejistoty (chybějící/nejednoznačné údaje) a nutnost klinické kontroly.
Tento příklad ukazuje princip „tool-augmented AI“, tj. orchestraci formálně definovaného nástroje (kalkulátoru) jazykovým modelem, nikoli nahrazení klinického úsudku.
Význam pro medicínskou informatiku a vzdělávání[upravit | editovat zdroj]
AgentMD je příkladem přístupu tool-augmented AI, kdy LLM neplní jen roli generátoru textu, ale koordinuje použití specializovaných nástrojů (zde klinických kalkulátorů). To je relevantní zejména v kontextu:
- klinické podpory rozhodování (CDS),
- automatizace práce s EHR,
- tzv. „ambient AI“ a AI scribů (zpracování klinické dokumentace),
- výuky práce s klinickými skórovacími systémy.
Dostupnost (článek, kód)[upravit | editovat zdroj]
Publikace je dostupná jako open access a je licencována pod Creative Commons Attribution 4.0 (CC BY 4.0).[1] Implementace a doprovodné materiály jsou dostupné v repozitáři NCBI-NLP na GitHubu.[3]
Reference[upravit | editovat zdroj]
- ↑ a b c d e f g h i j k JIN, Q, Z WANG a Y YANG. AgentMD: Empowering language agents for risk prediction with large-scale clinical tool learning. Nature Communications [online]. 2025, roč. 16, no. -, s. 9377, dostupné také z <https://www.nature.com/articles/s41467-025-64430-x>. PMID: -.DOI: 10.1038/s41467-025-64430-x.
- ↑ Jin Q et al.. AgentMD: Empowering Language Agents for Risk Prediction with Large-Scale Clinical Tool Learning (arXiv:2402.13225) [online]. arXiv, [cit. 2026-06-07]. <https://arxiv.org/abs/2402.13225>.
- ↑ NCBI-NLP. ncbi-nlp/Clinical-Tool-Learning [online]. GitHub, [cit. 2026-06-07]. <https://github.com/ncbi-nlp/Clinical-Tool-Learning>.
