FIZKES/SHUTTERSTOCK
Nedostaje ključno

Još nije dovoljno sposobna: umjetna inteligencija dala 80 posto netočnih dijagnoza

Unatoč stalnim poboljšanjima, standardni veliki jezični modeli nisu spremni za primjenu bez nadzora na kliničkoj razini

Generativnoj umjetnoj inteligenciji (UI) još nedostaju procesi rasuđivanja potrebni za sigurnu kliničku upotrebu te jezični modeli UI nisu sposobni postaviti odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva, otkrila je studija neprofitne bolnice i istraživačke mreže Mass General Brigham iz Bostona. Dijagnostička točnost se poboljšala kad je UI dobila sveobuhvatne kliničke informacije. Diferencijalna dijagnoza prvi je korak u identificiranju stanja i odvajanju od drugih stanja sa sličnim simptomima.

image

Iako UI obećava, ljudska klinička prosudba ostaje neophodna

SHUTTERSTOCK

Ljudska klinička prosudba ostaje neophodna

- Unatoč stalnim poboljšanjima, standardni veliki jezični modeli nisu spremni za primjenu bez nadzora na kliničkoj razini - rekao je Marc Succi, koautor studije objavljene u JAMA Network Open.

Istraživački tim analizirao je 21 veliki jezični model, uključujući najnovije verzije Claudea, DeepSeeka, Geminija, GPT-a i Groka, koristeći novorazvijeni alat PrIME-LLM koji procjenjuje sposobnost modela po fazama kliničkog rasuđivanja: postavljanja početne dijagnoze, naručivanja testova, donošenja konačne dijagnoze i planiranja liječenja. Kako bi simulirali razvoj kliničkih slučajeva, istraživači su postupno unosili podatke, počevši s osnovama poput dobi, spola i simptoma, prije dodavanja nalaza pregleda i laboratorijskih pretraga.

Nijedan od modela nije uspio dati točnu diferencijalnu dijagnozu u više od 80 posto slučajeva, no kod postavljanja konačne dijagnoze, kad su imali mnoštvo podataka i slika, uspješnost je bila od oko 60 do iznad 90 posto. Istraživači poručuju da, iako UI obećava, ljudska klinička prosudba ostaje neophodna.

08. lipanj 2026 14:12