Notícias

Pesquisadores estão criando software que ajudará a reconhecer dificuldades de fala em pacientes com Parkinson, disartria e outras condições

Todos entenderão: cientistas estão criando um programa para ajudar a reconhecer dificuldades de fala em pacientes com Parkinson, disartria e outras doenças

A inteligência artificial está sendo cada vez mais usada para fins médicos. Assim, a iniciativa Speech Accessibility Project lançada pela Universidade de Illinois em cooperação com gigantes da tecnologia como Google, Apple, Meta, Amazon e Microsoft ajudará a compreender melhor as pessoas com diversos distúrbios da fala.

Aqui está o que sabemos

O programa visa “decifrar” a fala arrastada de pessoas que sofrem, por exemplo, de doença de Parkinson, disartria e outras doenças neurológicas graves.

Para isso, são coletadas amostras de fala de pessoas com características diferentes, a fim de treinar uma rede neural para reconhecê-la e interpretá-la corretamente.

Como funciona

  • No início, são coletadas amostras de fala de pessoas com diferentes padrões e distúrbios de fala. Podem ser pessoas com sotaque, gagueira, dislexia, disartria e outras características;
  • as amostras de fala coletadas são analisadas e processadas para criar conjuntos de dados que são usados ​​para treinar a IA;
  • A IA aprende a reconhecer e interpretar padrões únicos dos pacientes e, uma vez testada, pode ser implementada em vários serviços (assistentes de voz, sistemas de ditado e outras tecnologias de reconhecimento de fala).

Até agora, o Projecto de Acessibilidade da Fala reconhece apenas 30% de fala difícil, mas os cientistas estão optimistas de que num futuro próximo conseguirão aumentar a eficiência do programa, o que por sua vez ajudará a melhorar a comunicação entre as pessoas.

Fonte: MedicalXpress

Além do desenvolvimento tecnológico, o Speech Accessibility Project também foca em criar um ambiente inclusivo para os utilizadores com dificuldades de fala. Este aspeto da inclusão é crucial, uma vez que muitas vezes as pessoas com distúrbios de comunicação enfrentam barreiras sociais e de interação, o que pode afetar sua autoestima e qualidade de vida. Com a implementação de tecnologias de reconhecimento de fala mais precisas, espera-se que essas barreiras possam ser significativamente reduzidas.

Os dados coletados não servem apenas para a formação da inteligência artificial. Eles também ajudam os pesquisadores a compreender melhor quais padrões de fala são mais desafiadores, permitindo que desenvolvam intervenções mais eficientes e personalizadas. Os cientistas enfatizam a importância de incluir uma diversidade de vozes, experiências e perfis demográficos nas amostras, de modo a garantir que a tecnologia seja aplicável a uma ampla gama de utilizadores.

Outro ponto importante a considerar é a ética envolvida na coleta e utilização de dados de fala. Os envolvidos no projeto trabalham para garantir que todos os participantes forneçam consentimento informado e que os seus dados sejam tratados com segurança e de maneira a preservar a privacidade. Isso é especialmente relevante em áreas como a saúde, onde a confidencialidade é uma prioridade.

A integração da IA em assistentes de voz populares, como Siri, Alexa e Google Assistant, também representa uma oportunidade para melhorar a acessibilidade. À medida que essas ferramentas se tornam mais adaptativas, é possível que pessoas com dificuldades de fala encontrem nas tecnologias de reconhecimento de voz um suporte diário e intuitivo, facilitando tarefas que antes poderiam ser complicadas ou frustrantes.

A medição do progresso do Speech Accessibility Project será feita não apenas em termos de precisão do reconhecimento, mas também na forma como a tecnologia impacta a vida dos utilizadores. As melhorias na comunicação poderão abrir novas portas em diversas esferas, como no ensino, no ambiente de trabalho ou nas interações sociais, criando um ecossistema mais inclusivo e compreensivo.

Os cientistas estão constantemente a refinar os algoritmos utilizados na IA, procurando abordagens mais eficientes que integram a informação linguística, tonalidade e entonação. As melhorias contínuas poderão, por fim, oferecer uma solução de melhor qualidade para o reconhecimento de diferentes tipos de fala, independentemente do originador, condição ou contexto.