Još nije dovoljno sposobna: umjetna inteligencija dala 80 posto netočnih dijagnoza

Učim

Unatoč stalnim poboljšanjima, standardni veliki jezični modeli nisu spremni za primjenu bez nadzora na kliničkoj razini

Piše:

Tamara Franjić

Objavljeno: 16. svibnja 2026. 10:40

Generativnoj umjetnoj inteligenciji (UI) još nedostaju procesi rasuđivanja potrebni za sigurnu kliničku upotrebu te jezični modeli UI nisu sposobni postaviti odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva, otkrila je studija neprofitne bolnice i istraživačke mreže Mass General Brigham iz Bostona. Dijagnostička točnost se poboljšala kad je UI dobila sveobuhvatne kliničke informacije. Diferencijalna dijagnoza prvi je korak u identificiranju stanja i odvajanju od drugih stanja sa sličnim simptomima.

Ljudska klinička prosudba ostaje neophodna

- Unatoč stalnim poboljšanjima, standardni veliki jezični modeli nisu spremni za primjenu bez nadzora na kliničkoj razini - rekao je Marc Succi, koautor studije objavljene u JAMA Network Open.

Istraživački tim analizirao je 21 veliki jezični model, uključujući najnovije verzije Claudea, DeepSeeka, Geminija, GPT-a i Groka, koristeći novorazvijeni alat PrIME-LLM koji procjenjuje sposobnost modela po fazama kliničkog rasuđivanja: postavljanja početne dijagnoze, naručivanja testova, donošenja konačne dijagnoze i planiranja liječenja. Kako bi simulirali razvoj kliničkih slučajeva, istraživači su postupno unosili podatke, počevši s osnovama poput dobi, spola i simptoma, prije dodavanja nalaza pregleda i laboratorijskih pretraga.

Nijedan od modela nije uspio dati točnu diferencijalnu dijagnozu u više od 80 posto slučajeva, no kod postavljanja konačne dijagnoze, kad su imali mnoštvo podataka i slika, uspješnost je bila od oko 60 do iznad 90 posto. Istraživači poručuju da, iako UI obećava, ljudska klinička prosudba ostaje neophodna.

Vezani članci

#umjetna inteligencija #klinička dijagnoza #zdravstvena tehnologija #medicinska istraživanja #diferencijalna dijagnoza #ljudska prosudba

Još nije dovoljno sposobna: umjetna inteligencija dala 80 posto netočnih dijagnoza

Hoće li nam ChatGPT ‘spržiti‘ mozak i uništiti pamćenje? Neurologinja Šarić objašnjava što se zapravo događa

Sestre Jelena i Marija osmislile su aplikaciju uz koju će kupovina proizvoda za zdravlje i ljepotu biti još lakša

Lijekovi za mršavljenje skidaju kilograme, ali nova studija otkriva i njihovu drugu stranu