Cercetătorii de la Harvard Medical School și de la Beth Israel Deaconess Medical Center din Statele Unite au comparat inteligența artificială și medicii într-o gamă largă de sarcini de raționament clinic, potrivit Euronews.
Ei au descoperit că modelele lingvistice mari (LLM) au depășit performanța medicilor în mai multe sarcini, inclusiv luarea deciziilor în camera de gardă pe baza informațiilor disponibile, identificarea diagnosticelor probabile și alegerea următorilor pași în management.
„Am testat modelul de inteligență artificială în raport cu aproape fiecare criteriu de referință și a eclipsat atât modelele anterioare, cât și valorile de referință ale medicilor noștri”, a declarat Arjun Manrai, co-autor principal și profesor la Harvard Medical School. „Totuși, acest lucru nu înseamnă că IA va îmbunătăți neapărat îngrijirea. Modul și locul în care ar trebui implementată rămân insuficient studiate și avem nevoie disperată de studii prospective riguroase pentru a evalua impactul IA asupra practicii clinice”.
Cercetătorii au evaluat mai întâi o1-preview, modelul de raționament OpenAI, căruia i-au oferit o serie de cazuri clinice, inclusiv conferințe de cazuri publicate și înregistrări din departamentele de urgență din lumea reală.
IA a depășit performanța medicilor umani în majoritatea experimentelor, în special în raționamentul managerial, raționamentul clinic, documentația și situațiile de urgență din lumea reală cu informații limitate.
„Modelele devin din ce în ce mai capabile. Obișnuiam să evaluăm modelele cu teste cu variante multiple de răspuns; acum acestea obțin constant scoruri apropiate de 100% și nu mai putem urmări progresul pentru că suntem deja la limita maximă”, a declarat co-autorul Peter Brodeur, cercetător clinician HMS în medicină la Beth Israel Deaconess, potrivit aceleiași surse.
Cea mai mare diferență dintre inteligența artificială și medicii umani a fost în etapa de triaj, în care informațiile despre pacient sunt mai limitate. La fel ca în cazul medicilor reali, modelele de inteligență artificială și-au îmbunătățit capacitățile de diagnostic pe măsură ce au devenit disponibile mai multe informații.
„Deși aplicarea inteligenței artificiale pentru a sprijini deciziile clinice este uneori considerată o activitate cu risc ridicat, o utilizare mai intensă a acestor instrumente ar putea servi la atenuarea costurilor umane și financiare ale erorilor de diagnostic, întârzierilor și lipsei de acces”, au scris autorii.
Cercetătorii au solicitat efectuarea de studii prospective pentru a evalua aceste tehnologii în contexte reale și ca sistemele de asistență medicală să investească în infrastructura de calcul și să dezvolte cadre care să poată sprijini integrarea în siguranță a instrumentelor de inteligență artificială în fluxurile de lucru clinice.
„Un model ar putea stabili corect diagnosticul principal, dar ar putea sugera și teste inutile care ar putea expune un pacient la probleme”, a spus Brodeur. „Oamenii ar trebui să fie punctul de referință suprem atunci când vine vorba de evaluarea performanței și a siguranței.”
Studiul are unele limitări. Autorii au menționat că studiul reflectă doar performanța modelului și se concentrează în principal pe versiunea preliminară a modelului o1, care a fost ulterior înlocuit de modele mai noi, cum ar fi modelul o3 al OpenAI.
„Deși ne așteptăm ca performanța să fie menținută sau îmbunătățită cu modele mai noi, ar trebui efectuate studii suplimentare pentru a elucida modul în care performanța variază între modele și pentru a studia modul în care oamenii și LLM-urile pot colabora”, au mai scris autorii.
(sursa: Mediafax)


