Recent, cercetătorii au descoperit că, în viitorul apropiat, o simplă înregistrare vocală ar putea ajuta medicii să detecteze semnele precoce ale cancerului la gât. Mai exact, cu ajutorul inteligenței artificiale, aceștia au reușit să distingă persoanele cu leziuni ale corzilor vocale de cele fără, pe baza anumitor caracteristici acustice din vocile lor, ba chiar au putut face diferenția între leziunile canceroase și cele benigne.

Într-un alt studiu, o femeie din Canada, paralizată aproape total după un accident vascular cerebral, a reușit să-și audă vocea din nou după 18 ani, datorită unui implant cerebral alimentat cu inteligență artificială, capabil să transforme activitatea creierului în cuvinte aproape în timp real. „La fel cum Siri traduce vocea în text, acest model AI traduce activitatea creierului în text sau audio ori animație facială”, explică oamenii de știință.

Deși nu se regăsește în Top 10 cele mai frecvente afecțiuni oncologice, la nivel global, cancerul de laringe reprezintă o povară importantă pentru sănătatea publică. În 2021, spre exemplu, au existat aproximativ 1,1 milioane de cazuri de cancer laringian la nivel mondial, iar aproximativ 100.000 de persoane au murit din cauza acestei boli. Factorii de risc majori sunt fumatul, abuzul de alcool și infecția cu virusul papiloma uman (HPV), iar prognosticul pentru acest tip de cancer variază de la 35% la 78% supraviețuire pe o perioadă de cinci ani, în cazul în care este tratat, în funcție de stadiul tumorii și de localizarea acesteia în laringe.

Depistarea precoce a cancerului laringian este esenţială pentru şansele de vindecare ale pacientului, deoarece îmbunătăţeşte semnificativ rezultatele tratamentului. Cu toate acestea, în prezent, cancerele de laringe sunt diagnosticate prin endoscopii nazale și biopsii - proceduri invazive și costisitoare, iar o programare la un specialist care poate efectua aceste proceduri poate dura destul de mult timp, provocând întârzieri în diagnosticare.

AI oferă o modalitate mai ușoară, mai rapidă și noninvazivă de diagnosticare

Cercetătorii spun, însă, că inteligența artificială ar putea detecta în curând cancerul de laringe fără toate aceste proceduri invazive și greoaie, ci doar ascultându-ți vocea.

O echipă de la Departamentul de Epidemiologie Clinică al Universității de Sănătate și Știință din Oregon (SUA) a demonstrat, într-un studiu recent publicat în Frontiers in Digital Health, că este posibilă detectarea anomaliilor apărute la corzile vocale - de la noduli inofensivi până la primele semne de cancer laringian - pur și simplu analizând înregistrări vocale scurte ale unei persoane.

În cercetarea ei, echipa a analizat peste 12.500 de înregistrări vocale de la 306 persoane (atât sănătoase, cât și cu diverse probleme medicale la gât) și s-au concentrat pe markeri acustici subtili, precum: frecvența fundamentală, care indică înălțimea sunetului și intonația; jitterul, care măsoară fluctuațiile frecvenței fundamentale și semnifică controlul corzii vocale; strălucirea, care cuantifică fluctuațiile amplitudinilor undelor sonore și poate indica prezența leziunilor care interferează cu mișcarea corzilor vocale, și raportul armonice-zgomot (HNR), care poate indica o închidere incorectă a corzilor.

Prinde indicii care scapă urechii umane

Analizând toți acești biomarkeri vocali, cercetătorii au descoperit diferențe marcante în raportul armonice-zgomot și în frecvența fundamentală între persoanele fără tulburări vocale, cei cu leziuni benigne ale corzilor vocale și cei cu cancer laringian.

Constatările sugerează că variațiile raportului armonice-zgomot, în mod special, ar putea ajuta la urmărirea leziunilor corzilor vocale și la detectarea precoce a cancerului, iar următorul pas este utilizarea acestor algoritmi pe mai multe date și testarea lor în contexte clinice pe vocile pacienților.

„Rezultatele noastre sugerează că seturi mari de date, provenite din mai multe instituții, provenite din surse etice, precum Bridge2AI Voice, ar putea contribui în curând la transformarea vocii noastre într-un biomarker practic pentru riscul de cancer în îngrijirea clinică”, a declarat Philip Jenkins, cercetător postdoctoral în informatică clinică la Universitatea de Sănătate și Știință din Oregon, într-un comunicat de presă.

Jenkins a menționat, de asemenea, că instrumentele de sănătate bazate pe voce sunt deja testate și estimează că instrumente similare pentru detectarea anomaliilor corzilor vocale vor intra în curând în teste-pilot.

Practic, în viitorul apropiat, o verificare rapidă a vocii ar putea deveni la fel de uzuală ca măsurarea temperaturii.

Această cercetare a făcut parte din proiectul Bridge2AI-Voice din cadrul inițiativei „Bridge to Artificial Intelligence” (Punte către Inteligența Artificială) a Institutului Național de Sănătate din SUA, un efort național de aplicare a inteligenței artificiale la provocări biomedicale complexe.

Mai multe despre acest studiu poate fi citit aici: https://www.frontiersin.org/journals/digital-health/articles/10.3389/fdgth.2025.1609811/full

O femeie și-a auzit vocea cu ajutorul AI, la 18 ani după ce a rămas paralizată

Tot pe Inteligența Artificială se bazează și un alt studiu clinic, condus de cercetătorii americani de la UC Berkeley și UC San Francisco, care vizează restabilirea vorbirii pentru persoanele cu paralizie severă.

Cu ajutorul unui implant cerebral alimentat de AI, aceștia au reușit, practic, să restabilească vorbirea la o pacientă paralizată aproape în totalitate, care nu mai vorbise de 18 ani.

Ann Johnson, fostă profesoară de liceu și antrenor în Canada, a suferit un accident vascular cerebral la vârsta de 30 de ani, AVC care provocat sindromul locked-in, o afecțiune rară în care o persoană rămâne conștientă, dar incapabilă să vorbească sau să se miște. De atunci, ea a comunicat cu familia folosind un sistem de urmărire a ochilor, prin care reușea să scrie pe un ecran doar 14 cuvinte pe minut, o viteză de conversație departe de a fi naturală.

În 2022, ea a devenit al treilea participant la studiul clinic amintit mai sus, iar echipa de cercetători a folosit o neuroproteză care înregistrează semnalele de la cortexul motor al vorbirii, ocolind căile neuronale deteriorate pentru a produce cuvinte ce pot fi auzite.

Dispozitivul se bazează pe un implant plasat peste zona creierului corespunzătoare vorbirii, iar când femeia încearcă să vorbească, implantul detectează activitatea neuronală și trimite semnalele către un computer conectat. Un decodor AI traduce apoi aceste semnale în text, vorbire sau animație facială pe un avatar digital. Pentru a personaliza experiența, echipa a recreat vocea femeii, folosind o înregistrare a discursului ei de nuntă, din 2004.

„La fel cum Siri traduce vocea în text, acest model AI traduce activitatea creierului în text sau audio sau animație facială”, a explicat Kaylo Littlejohn, doctorand la UC Berkeley și unul dintre autorii principali ai studiului, citat într-un comunicat al universității.

Practic, datorită acestei interfețe creier-computer, care decodifică vorbirea direct din activitatea creierului, Ann Johnson și-a auzit vocea din nou, după 18 ani de la AVC-ul care a lăsat-o paralizată.

Autorii cercetării spun că dispozitivul poate simți în mod fiabil intenția de a vorbi și apoi traduce ceea ce încearcă să spună, dar nu poate citi gândurile unei persoane atunci când nu vrea să vorbească. Practic, funcționează doar atunci când cineva se concentrează și face un efort de a spune ceva.

Cercetătorii principali spun că, acum, scopul lor este de a transforma neuroprotezele din sisteme experimentale în instrumente clinice standard. Îmbunătățirile viitoare ar putea include implanturi wireless, eliminând nevoia de conexiuni directe la computer și avatare fotorealiste pentru interacțiuni mai naturale.

