Projeto piloto colaborativo cria ferramenta no celular para o Swahili, segundo idioma mais falado na África

Foto de Eli Duke via Flickr (CC BY-SA 2.0)

Falado por aproximadamente 100 milhões de pessoas, o Swahili é o segundo idioma mais utilizado no continente africano, depois do árabe. Entretanto, serviços como Reconhecimento Automático de Voz (ASR) não estão disponíveis no mercado, negando a muitos usuários com deficiências ou que não são alfabetizados o direito à informação de que tanto precisam no dia a dia. Mas essa realidade pode mudar muito em breve a partir de parcerias entre startups de pesquisa e de tecnologia que estão desenvolvendo ferramentas tecnológicas localizadas para os falantes de Swahili.

Busca na Internet em celulares

Uma dessas promissoras inovações está para ser implementada no Quênia. Uliza (que significa “pergunte” em Swahili) é uma interface de voz que permite acesso à informação na Internet por meio de um celular comum.

Basta ligar e fazer a pergunta em Swahili. Entre 15 e 90 minutos, um “agente de resposta” (na verdade, uma pessoa trabalhando nos bastidores) envia a resposta oralmente. Atualmente, um grupo de aproximadamente 50 agentes cuida das perguntas, transcrevendo as gravações, pesquisando as respostas online em vários idiomas, traduzindo a informação e a enviando para a pessoa que fez a pergunta em Swahili.

No projeto piloto feito na capital do Quênia, Nairobi, e no oeste do país, cerca de 600 Usuários Beta enviaram perguntas sobre seus representantes locais, pediram ajuda para resolver trabalhos de casa em Swahili e solicitaram informações médicas delicadas demais para serem abordadas pessoalmente.

Durante o projeto piloto Uliza, essas foram as palavras presentes nas perguntas mais frequentes feitas pelos usuários (traduzidas do Swahili para o Inglês).

Uliza resolverá outro problema para seus futuros usuários: a falta de informação oferecida na Internet. São muitas as razões que se sobrepõem: pacote de dados de internet caros de mais para a maioria, cybercafés distantes, desconhecimento dos idiomas mais amplamente falados, além de uma escassez de conteúdo nos idiomas locais.

Não se trata de um problema tecnológico

O modelo de colaboração coletivo do Uliza exige mão de obra intensa, mas também traz uma enorme vantagem: como a transcrição e a tradução são feitas por pessoas de carne e osso, temporariamente é possível contornar a falta de um vasto conjunto de dados de voz que geralmente restringem os esforços de ASR em idiomas falados na África, enquanto simultaneamente reúnem dados de falantes reais em uma variedade de acentos e dialetos. O fundador do Uliza, Grant Bridgman, pretede utilizar esse banco de dados de gravações e transcrições curtas para criar um Aprendizado de Máquina (processo de aprendizado e capacidade de uma máquina de se adaptar às situações e evoluir sozinha) e gerenciar automaticamente todo o sistema no futuro. No vídeo abaixo, Bridgman explica o conceito por detrás do projeto em uma palestra na Universidade Tufts:

Boa parte da pesquisa já está sendo utilizada para construir um software de ASR no idioma Swahili e em outros idiomas falados na África, mas ainda resta um longo caminho para que a maioria da população tenha acesso às benesses da tecnologia. Em uma entrevista ao Global Voices, Bridgman comentou:

The technology exists and all of this is already available for first world languages, now we need to find a commercial model to make it viable for low-resource languages.

A tecnologia existe e está disponível para aqueles que falam os idiomas dos países ricos. Agora precisamos encontrar um modelo comercial para tornar viável essa tecnologia nos idiomas de países com poucos recursos.

Empresas interessadas em criar centrais de atendimento de baixo custo para consumidores em zonas rurais são potenciais clientes na fase inicial do projeto Uliza. Futuramente, a meta é implementar um serviço que permitirá que usuários sem acesso à Internet no celular encontrem respostas para suas perguntas e façam upload de seus próprios conteúdos de voz. O custo para o usuário seria mínimo — aproximadamente o mesmo custo de enviar um “torpedo” (SMS).

O modelo Uliza pode ser utilizado para outros idiomas com grande número de falantes. Mas, para a vasta maioria dos que usam os mais de 2 mil idiomas existentes no continente africano, essa possibilidade é remota. Entretanto, soluções podem vir a surgir a partir de um projeto de pesquisa liderado por Preethi Jyothi, do Beckman Institute. Lá, uma equipe de pesquisadores utilizaram um método probabilístico para realizar transcrições de forma colaborativa com falantes não nativos. Uma vez ajustado o método, a transcrição probabilística possibilitaria a criação da tecnologia ASR para idiomas menos representativos e, quem sabe, por preço razoável.

Inicie uma conversa

Colaboradores, favor realizar Entrar »

Por uma boa conversa...

  • Por favor, trate as outras pessoas com respeito. Trate como deseja ser tratado. Comentários que contenham mensagens de ódio, linguagem inadequada ou ataques pessoais não serão aprovados. Seja razoável.