AgentMD

AgentMD je experimentální systém AI agenta, který automatizuje vyhledání, vytvoření a použití klinických kalkulátorů pro predikci rizik. Byl vyvinut týmem National Library of Medicine (NIH, USA) a publikován v říjnu 2025 v časopise Nature Communications.^[1]

Pozadí a motivace[upravit | editovat zdroj]

Klinické kalkulátory (skórovací systémy) podporují odhad rizika a klinické rozhodování (např. HEART pro odhad kardiálního rizika nebo CURB-65 u pneumonie). V rutinní praxi však jejich používání naráží na několik bariér: je nutné vědět, který kalkulátor zvolit a kdy, často chybí dobrá integrace do elektronické zdravotnické dokumentace (EHR) a manuální zadávání údajů je časově náročné a chybové. Šíření nových kalkulátorů do praxe navíc bývá pomalé.

Velké jazykové modely a na nich postavení AI agenti mohou část těchto kroků automatizovat (výběr vhodného nástroje, extrakce vstupů z textu, spuštění výpočtu a srozumitelné shrnutí výsledku).

Popis systému AgentMD[upravit | editovat zdroj]

AgentMD je navržen ve dvou komplementárních rolích: jako tvůrce nástrojů (tool builder) a uživatel nástrojů (tool user). Architektura je popisována jako nezávislá na konkrétním LLM (LLM-agnostic).^[1]

Tvůrce nástrojů (tool builder)[upravit | editovat zdroj]

V roli tvůrce nástrojů AgentMD prochází databázi PubMed a identifikuje publikace popisující klinické kalkulátory. Z textu publikace následně:

extrahuje strukturu kalkulátoru, vstupní proměnné a interpretaci výsledků,
generuje spustitelnou implementaci (např. funkci v Pythonu),
provede automatizovanou kontrolu kvality a jednotkové testy (unit tests).^[1]

Výstupem je knihovna RiskCalcs obsahující 2 164 spustitelných klinických kalkulátorů napříč medicínskými obory.^[1]

Uživatel nástrojů (tool user)[upravit | editovat zdroj]

V roli uživatele nástrojů AgentMD při zadaném klinickém scénáři (např. text příjmové zprávy) typicky:

vybere relevantní kalkulátory z knihovny RiskCalcs,
extrahuje požadované vstupní parametry z klinického textu,
provede výpočet a vytvoří interpretaci výsledku,
připraví shrnutí pro klinika nebo pro analytické účely.^[1]

Výsledky hodnocení[upravit | editovat zdroj]

Kvalita knihovny RiskCalcs[upravit | editovat zdroj]

Manuální hodnocení (anotátoři, dva vzorky – 50 nejcitovanějších a 50 náhodně vybraných kalkulátorů) uvádí:

přesnost kontroly kvality >85 %,
úspěšnost jednotkových testů >90 %.^[1]

Benchmark RiskQA[upravit | editovat zdroj]

Pro hodnocení výběru a aplikace kalkulátorů byl sestaven dataset RiskQA (350 úloh s výběrem odpovědí). Autoři porovnávají AgentMD s baseline založenou na GPT-4 bez agentního rámce a bez přístupu ke knihovně kalkulátorů (promptování typu chain-of-thought).^[1]^[2]

Model	Přesnost (accuracy)
AgentMD	87,7 %
GPT-4 (bez agentního rámce, bez RiskCalcs)	40,9 %

Validace na reálných datech[upravit | editovat zdroj]

Autoři dále hodnotí použitelnost na klinických poznámkách (extrakce vstupů, výpočet a sumarizace výsledků) ve dvou datasetech:^[1]

Datová sada	Popis	Příklad typu úlohy
Yale Medicine ED notes	698 příjmových poznámek z urgentního příjmu	Individuální predikce rizik ve vybraných scénářích
MIMIC-III	9 822 příjmových poznámek z JIP/ICU	Populační analýzy (agregované charakteristiky a rizika)

Bezpečnost a klinické použití[upravit | editovat zdroj]

AgentMD je popsaný jako výzkumný rámec a jeho výsledky nelze bez dalšího považovat za podklad pro autonomní klinické rozhodování. I při správném výběru kalkulátoru může dojít k chybám při extrakci vstupních proměnných z volného textu, při mapování proměnných na definice z publikace nebo při interpretaci výstupu v kontextu konkrétního pacienta.^[1]

Pro praktické nasazení je proto nutná:

další klinická validace v širších a heterogenních souborech,
testování robustnosti (chybějící/atypické vstupy, neúplná dokumentace),
bezpečné zapojení do pracovních postupů a EHR,
jasné vymezení odpovědnosti a etických pravidel při použití AI v klinickém prostředí.^[1]

Mini-kazustika (ilustrační příklad)[upravit | editovat zdroj]

Hypotetický scénář: pacient přijat s podezřením na komunitní pneumonii; v textu příjmu jsou uvedeny např. věk, dechová frekvence, krevní tlak, stav vědomí a laboratorní údaj o uree.

Možný postup v rámci AgentMD:

Agent z klinického textu rozpozná, že je vhodné použít např. CURB-65 (pokud jsou dostupné vstupy).
Z textu vytěží potřebné proměnné (nebo označí chybějící hodnoty).
Spustí výpočet skóre a vrátí výsledek společně s přehledem použitých vstupů a interpretací skóre dle definice kalkulátoru.
Upozorní na nejistoty (chybějící/nejednoznačné údaje) a nutnost klinické kontroly.

Tento příklad ukazuje princip „tool-augmented AI“, tj. orchestraci formálně definovaného nástroje (kalkulátoru) jazykovým modelem, nikoli nahrazení klinického úsudku.

Význam pro medicínskou informatiku a vzdělávání[upravit | editovat zdroj]

AgentMD je příkladem přístupu tool-augmented AI, kdy LLM neplní jen roli generátoru textu, ale koordinuje použití specializovaných nástrojů (zde klinických kalkulátorů). To je relevantní zejména v kontextu:

klinické podpory rozhodování (CDS),
automatizace práce s EHR,
tzv. „ambient AI“ a AI scribů (zpracování klinické dokumentace),
výuky práce s klinickými skórovacími systémy.

Dostupnost (článek, kód)[upravit | editovat zdroj]

Publikace je dostupná jako open access a je licencována pod Creative Commons Attribution 4.0 (CC BY 4.0).^[1] Implementace a doprovodné materiály jsou dostupné v repozitáři NCBI-NLP na GitHubu.^[3]

Reference[upravit | editovat zdroj]

↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k JIN, Q, Z WANG a Y YANG. AgentMD: Empowering language agents for risk prediction with large-scale clinical tool learning. Nature Communications [online]. 2025, roč. 16, no. -, s. 9377, dostupné také z <https://www.nature.com/articles/s41467-025-64430-x>. PMID: -.DOI: 10.1038/s41467-025-64430-x.
↑ Jin Q et al.. AgentMD: Empowering Language Agents for Risk Prediction with Large-Scale Clinical Tool Learning (arXiv:2402.13225) [online]. arXiv, [cit. 2026-06-07]. <https://arxiv.org/abs/2402.13225>.
↑ NCBI-NLP. ncbi-nlp/Clinical-Tool-Learning [online]. GitHub, [cit. 2026-06-07]. <https://github.com/ncbi-nlp/Clinical-Tool-Learning>.

Externí odkazy[upravit | editovat zdroj]

Původní článek v Nature Communications (open access)
Preprint na arXiv
Repozitář GitHub (kód a materiály)

[Jin2025-1] ↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k JIN, Q, Z WANG a Y YANG. AgentMD: Empowering language agents for risk prediction with large-scale clinical tool learning. Nature Communications [online]. 2025, roč. 16, no. -, s. 9377, dostupné také z <https://www.nature.com/articles/s41467-025-64430-x>. PMID: -.DOI: 10.1038/s41467-025-64430-x.

[arxiv-2] Jin Q et al.. AgentMD: Empowering Language Agents for Risk Prediction with Large-Scale Clinical Tool Learning (arXiv:2402.13225) [online]. arXiv, [cit. 2026-06-07]. <https://arxiv.org/abs/2402.13225>.

[github-3] NCBI-NLP. ncbi-nlp/Clinical-Tool-Learning [online]. GitHub, [cit. 2026-06-07]. <https://github.com/ncbi-nlp/Clinical-Tool-Learning>.

[1]

[2]

[3]


			Sport + Pivo + WikiSkripta = Dobronice
			Pojeďte s námi na Letní školu wiki do Dobronic 19.–26. 7. 2026! Ještě není pozdě na to se přihlásit! Podrobnosti zde!