ChatGPT a fost testat cu succes pentru promovarea unui examen dificil la medicină

SURSA FOTO: Dreamstime

10 februarie 2023, 19:51 de Antuanela Raileanu

Inteligența artificială evoluează cu pași rapizi. Sowtware-ul ChatGPT a fost testat pentru promovarea unui examen dedicat studenților la medicină, în urma căruia a obţinut un punctaj situat între 52,4% şi 75% răspunsuri corecte.

Din cuprinsul articolului

ChatGPT a fost testat pe 350 dintre cele 376 de întrebări
Testul a presupus mai multe tipuri de întrebări
Lucrarea este o parte a unei serii de noi dezvoltări entuziasmante în domeniul inteligenţei artificiale

Software-ul ChatGPT, care generează texte cu ajutorul inteligenţei artificiale (AI), s-a „apropiat de marja de succes” pentru a trece un examen medical dificil în SUA, conform unui studiu publicat, joi, 9 februarie.

ChatGPT a fost testat pe 350 dintre cele 376 de întrebări

Start-upul californian OpenAI a lansat în noiembrie 2022 un robot conversaţional care a făcut furori de atunci. Acesta produce texte – eseuri, articole sau chiar poezii – la cerere.

În cadrul studiului care a fost publicat în jurnalul PLOS Digital Health, cercetătorii de la compania AnsibleHealth au testat capacitățile software-ului la un examen pe care trebuie să îl susţină studenţii la medicină din SUA şi care conţine întrebări din diverse domenii (cunoştinţe ştiinţifice, raţionament clinic, bioetică şi altele).

Cunoscut sub denumirea USMLE (United States Medical Licensing Examination), examenul este împărțit în trei părţi: prima se susţine după aproximativ doi ani de studiu, a doua după patru ani, iar a treia este necesară pentru a deveni medic.

Așadar, ChatGPT a fost testat pe 350 dintre cele 376 de întrebări publicate pe site-ul USMLE şi care au făcut parte din examenul din iunie 2022. Întrebările care conţineau imagini au fost eliminate, transmite AFP.

Testul a presupus mai multe tipuri de întrebări

Întrebările au fost prezentate în trei moduri: întrebări deschise („Care ar fi diagnosticul pentru acest pacient având în vedere informaţiile prezentate?”), întrebări cu opţiuni multiple fără justificare („Care este etapa următoare de monitorizare cea mai potrivită?”) şi întrebări cu opţiuni multiple cu justificare („Care este motivul cel mai probabil pentru simptomele nocturne ale pacientului? Explicaţi-vă raţionamentul”).

Doi examinatori au punctat lucrarea, iar altul a rezolvat discrepanţele dintre primii doi. ChatGPT a obţinut un punctaj situat între 52,4% şi 75% răspunsuri corecte. În general, rezultatul necesar pentru a promova examenul este de 60%. Astfel, „ChatGPT se apropie de marja de succes”, a arătat studiul.

Lucrarea este o parte a unei serii de noi dezvoltări entuziasmante în domeniul inteligenţei artificiale

Mai mulți experți au criticat metoda utilizată. Cercetătorii ar fi putut introduce un anumit grad de anonimizare prin amestecarea răspunsurilor umane cu cele ale robotului, consideră Nello Cristianini, profesor de inteligenţă artificială la Universitatea din Bath, Regatul Unit. Totuși el a descris lucrarea drept „parte a unei serii de noi dezvoltări entuziasmante în domeniul inteligenţei artificiale”.

De asemenea, Lucia Ortiz de Zarate, cercetătoare la Universitatea Autonomă din Madrid, Spania, a afirmat că acest studiu demonstrează „potenţialul AI în domeniul medical”. AI „se poate dovedi de mare ajutor medicilor atunci când formulează diagnostice şi prescriu tratamente”, declară ea.

La sfârşitul lunii ianuarie, un alt studiu a demonstrat că ChatGPT ar putea reuşi să rezolve examenele unei universităţi de drept din Statele Unite, chiar dacă ar fi ultimul din clasă.