Enlaces accesibilidad

Una mujer con parálisis recupera el habla gracias a unos implantes cerebrales y un avatar digital

  • Los nuevos dispositivos generan texto a una media de 78 y 62 palabras por minuto y amplían el vocabulario
  • Uno de ellos, además, añade un avatar que sintetiza la voz y reproduce expresiones de felicidad o tristeza

Por
Implantes cerebrales y un avatar digital "devuelven" el habla a una mujer con parálisis
Es un avance para la comunicación de las personas con ELA o que han tenido un ictus.

Algunas enfermedades dejan atrapados en el silencio a quienes las padecen. La tecnología que trata de devolverles la capacidad de comunicarse traduciendo la actividad cerebral en palabras ha desarrollado dos nuevos tipos de implantes que hacen más rápido, preciso y variado ese proceso. Investigadores de la Universidad de Stanford (Estados Unidos) han desarrollado unos implantes cerebrales y un software que plasman en la pantalla del ordenador las palabras de una persona con discapacidad del habla.

El estudio, publicado en la revista Nature, se basa en el hecho de que el cerebro recuerda cómo formular palabras, aunque los músculos responsables de pronunciarlas en voz alta estén incapacitados, Ahora esta nueva conexión cerebro-ordenador hace realidad el sueño de recuperar el habla en pacientes que la han perdido.

Una de las dos nuevas interfaces cerebro-ordenador (BCI), sobre las que se publican sendos artículos en la revista Nature, no solo traduce la actividad neuronal en texto, sino que se complementa con un avatar digital que puede sintetizar la voz, similar a la que tenía el usuario, y algunas expresiones faciales.

Los nuevos dispositivos generan texto a una media de 78 y 62 palabras por minuto, respectivamente, todavía lejos de las 160 de la conversación normal, pero muy por encima de otras pruebas, además amplían el vocabulario y reducen la tasa de errores.

Facilitar la comunicación de personas con ELA que han sufrido un ictus

Estas interfaces son por ahora pruebas de concepto limitadas al laboratorio, pero suponen un avance significativo en el propósito de facilitar la comunicación a personas con un grado de parálisis de los músculos que les imposibilita el habla debido, por ejemplo, a un ictus o la esclerosis lateral amiotrófica (ELA).

"Con estos nuevos estudios, es posible imaginar un futuro en el que podamos devolver la fluidez de la conversación a alguien con parálisis, permitiéndole decir libremente lo que quiera con una precisión lo bastante alta como para que se le entienda con fiabilidad", ha explicado en una rueda de prensa virtual Frank Willet, coordinador de uno de los estudios de la Universidad de Stanford (EE.UU.).

El primer BCI es responsabilidad de un equipo liderado por Edward Chang, de la Universidad de California en San Francisco, y ha permitido a una mujer, identificada como Ann y con parálisis severa por un derrame cerebral, hablar a través de un avatar digital.

Funcionamiento del procedimiento

El sistema genera una media de 78 palabras por minuto, con un 28% de error para un vocabulario de más de 39.000 palabras.

El equipo ha implantado un rectángulo fino como un papel con 253 electrodos en la superficie del cerebro de la mujer, en zonas fundamentales para el habla, los cuales interceptan las señales cerebrales que, de no haber sido por el ictus, habrían ido a parar a los músculos de la lengua, la mandíbula, la laringe y la cara. Un cable, conectado a un puerto fijado a su cabeza, conectaba los electrodos a un banco de ordenadores.

El siguiente paso ha sido entrenar un modelo de aprendizaje profundo para reconocer las señales cerebrales únicas de Ann relacionadas con el habla mientras ella intentaba pronunciar frases completas en silencio.

Esta inteligencia artificial no reconoce palabras, sino los 39 fonemas que componen el inglés hablado, lo que ha mejorado la precisión del sistema y lo ha hecho tres veces más rápido.

No solo palabras, también el lenguaje no verbal como los gestos

Pero el equipo no se ha limitado a descodificar las señales del habla en texto, porque la comunicación no son solo palabras. "Nuestra voz y expresiones faciales forman parte de nuestra identidad", ha recalcado Chang en el encuentro con la prensa.

Así, han creado un algoritmo para sintetizar el habla, que han personalizado para que sonara como la voz de Ann antes de la lesión, utilizando una grabación de la mujer en su boda, como ha explicado Sean Metzger, de la Universidad de California. El sistema se completa con un avatar en la pantalla del ordenador animado por un software que simula los movimientos musculares de la cara al hablar y además reproduce expresiones como felicidad, sorpresa o tristeza.

Metzger ha matizado que este avatar es una prueba de concepto preliminar, pero creen que "podría ser una tecnología potente para comunicarse sin hablar activamente".

Todavía lejos de usarse en la vida cotidiana, pero son un avance

El segundo BCI presentado ha ayudado a Patt Bennet, de 68 años, a empezar a comunicarse de nuevo. En 2012 le diagnosticaron ELA, enfermedad que le afectó en primer lugar los músculos de la cara, lengua y faringe. Aunque su cerebro puede formular instrucciones para generar fonemas, ella solo puede producir algún sonido no articulado.

"Cuando uno piensa en la ELA, piensa en el impacto en brazos y piernas -escribe Bennett en una entrevista realizada por correo electrónico-, pero en un grupo de pacientes de ELA, comienza con dificultades en el habla. Yo soy incapaz de hablar".

Willet, coordinador de este segundo equipo, de la Universidad de Stanford, ha explicado que la mayor diferencia entre ambos dispositivos es la tecnología de registro, en su caso a base de matrices de microelectrodos de alta resolución que pueden registrar la actividad de neuronas individuales. En 2022, el equipo implantó en el córtex cerebral de la paciente dos pequeños sensores que forman parte de un BCI para traducir en palabras en una pantalla la actividad cerebral que acompaña a los intentos de habla de Bennet.

Así, un algoritmo de inteligencia artificial recibe y descodifica la información electrónica procedente del cerebro y acaba aprendiendo a distinguir la actividad cerebral asociada a sus intentos de formular cada uno de los 39 fonemas.

Tras 25 sesiones de cuatro horas para entrenar el software, los intentos de Bennett de hablar se convirtieron en palabras en la pantalla de un ordenador a una velocidad de 62 palabras por minuto, con una tasa de error del 23,8% para un vocabulario de 125.000 palabras. Estos dispositivos aún están lejos de poder usarse en la vida cotidiana, pero son un gran avance hacia ese objetivo, como han coincidido los dos equipos.

Con estos trabajos "hemos cruzado el umbral del rendimiento y estamos entusiasmados por cruzar el de la usabilidad. Ya no es una cuestión de si es posible", ha destacado Chang.

Ambos científicos destacaron la labor de los participantes en estos ensayos experimentales que, como tal, se realizan por un tiempo limitado. Son "realmente un grupo especial de personas", que -ha destacado Willet- "no esperan ningún beneficio de este ensayo y solo están interesados en ayudar a impulsar la tecnología".