Dissertação
AUTOMAÇÃO RESIDENCIAL POR COMANDOS DE VOZ PARA PESSOAS COM MOBILIDADE REDUZIDA
Nos últimos anos, tem se observado um crescimento de tecnologias voltadas à Automação Industrial ou Residencial. O comando de voz para automação residencial é uma área de pesquisa emergente, devido ao surgimento de diversas plataformas embarcadas, simples e de baixo custo, com alto poder de processamento e tamanho reduzido. A utilização de sistemas de automação controlados por voz é indiscutivelmente interessante às pessoas portadoras de necessidades especiais, idosos, nas quais a fala pode substituir algumas ações motoras. Pode ser realizada de forma independente ou dependente do locutor. Nesse sentido, este projeto aborda o desenvolvimento de um sistema de reconhecimento automático de fala, de baixo custo, independente do locutor, que utiliza comandos isolados. O trabalho se divide em duas abordagens. Na primeira, foi empregada a plataforma Raspberry PI B+. O sistema foi testado com o Pocketsphinx na língua inglesa com uma placa de circuito própria desenvolvida para o acionamento das cargas, com a finalidade de avaliar eficiência e eficácia do software. Foi obtida uma taxa de reconhecimento de 90,4%, com resposta rápida do sistema. Na segunda abordagem, o sistema de reconhecimento é baseado na língua portuguesa, utilizando a plataforma embarcada Raspberry PI Zero W, ESP8266 12E e o software Jasper, tendo a placa de controle dos dispositivos separada do Raspberry Pi Zero W. A fala é convertida em texto usando o Google speech. Após validado o comando, o mesmo é enviado ao ESP8266 12E através de um roteador que permite ações de controle, como aparelhos eletroeletrônicos ou envio de mensagens SMS, com o intuito de dar autonomia, segurança e comodidade às pessoas com mobilidade reduzida. O sistema proposto foi avaliado através de aspectos de integridade, tais como sensibilidade a ruídos do meio, sensibilidade de aceite da pronúncia das palavras de acordo com o idioma escolhido e detecção de falso-positivo. Nos testes realizados com a segunda abordagem obteve-se uma taxa de acertos de 99,67 %, indicando que a proposta se mostra viável para a criação de uma interface por reconhecimento automático de fala com baixo custo.