Pela primeira vez, uma pessoa com paralisia grave conseguiu “falar” em tempo real usando apenas sinais cerebrais captados por um chip. O feito foi conquistado por pesquisadores das universidades de Berkeley e de San Francisco, ambas nos Estados Unidos, que desenvolveram uma interface cérebro-computador que parece ser capaz de traduzir a atividade neural em palavras e as transforma em voz simultaneamente.
O estudo, publicado na Nature Neuroscience nessa segunda-feira (31/3), supera um desafio mesmo das tecnologias mais modernas: nelas, há uma demora entre a decodificação do pensamento e a produção de som por pessoas com paralisia. A nova técnica permite uma comunicação mais fluida e naturalista do que já havia sido observada anteriormente.
Como os impulsos cerebrais viram voz?
A neuroprótese usada por Ann, paciente que teve sua identidade preservada, capta sinais do córtex motor, região cerebral responsável pelo controle da fala, e os traduz em palavras usando modelos de linguagem: como um ditado, ela repete o que a máquina sugere para treinar o algoritmo.
A equipe treinou o sistema do implante com dados de Ann, que tentava pronunciar frases mentalmente enquanto via prompts em uma tela.
“Interceptamos sinais onde o pensamento deveria virar articulação dos músculos da fala e os interpretamos. Então, o que estamos decodificando é depois que um pensamento aconteceu, depois que decidimos o que dizer, depois que decidimos quais palavras usar e como mover nossos músculos do trato vocal”, explica o neurologista Cheol Jun Cho, um dos coautores do estudo, em comunicado à imprensa.
Para recriar a voz original de Ann, os pesquisadores usaram gravações anteriores à lesão cerebral dela para elaborar os modelos de texto-para-voz. “Assim, o sistema soa mais parecido com ela e permite que ela se identifique”, diz Cho.
Chip com velocidade e precisão sem precedentes
Em testes anteriores, a decodificação levava até oito segundos por frase. Agora, o sistema gera fala audível em menos de um segundo após a intenção de falar.
“Dentro de 1 segundo, temos o primeiro som. E o dispositivo pode decodificar continuamente a fala, então Ann pode continuar falando sem interrupção. Os modelos anteriores demoravam oito segundos e não permitiam isso”, afirma o professor Gopala Anumanchipalli, autor principal do estudo.
A espera reduzida não comprometeu a precisão, mantendo taxas altas de acerto mesmo com palavras novas. Ann relatou que a experiência com a nova técnica foi mais intuitiva. “Ouvir a própria voz em tempo quase real aumentou o senso de corporificação dela, segundo nossas avaliações”, destacou Anumanchipalli. O próximo passo é incorporar variações de tom e emoção, tornando a fala ainda mais expressiva.
Um futuro mais acessível
A tecnologia funciona com diferentes métodos de captação neural, incluindo eletrodos invasivos e sensores não invasivos. O avanço abre caminho para aplicações práticas, como ajudas comunicativas portáteis.
“Isso pode melhorar drasticamente a qualidade de vida de pessoas com paralisia severa”, completa Anumanchipalli. Com ajustes, a técnica pode devolver não apenas palavras, mas a voz única de cada indivíduo — um passo crucial para reintegrar autonomia e conexão humana.
Siga a editoria de Saúde e Ciência no Instagram e no Canal do Whatsapp e fique por dentro de tudo sobre o assunto!