- Global Voices em Português - https://pt.globalvoices.org -

Perdido na tradução: Por que o Google Tradutor costuma errar com o iorubá e outros idiomas

Categorias: África Subsaariana, Nigéria, Desenvolvimento, Ideias, Língua, Mídia Cidadã, Mídia e Jornalismo, Tecnologia, Rising Voices
[1]

Usuário do Wikimedia Group Nigeria. Outubro de 2018 via Wikimedia Commons CC.BY.2.0.

A língua inglesa tem predominado no discurso on-line como forma “universal” de comunicação desde os primórdios da internet. Em fevereiro de 2020, mais da metade [2] dos sites conectados à rede mundial estavam em inglês, de acordo com a WebTech3.

Mas à medida em que mais falantes de diferentes línguas se conectaram, deu-se início a uma revolução linguística digital — com acesso imediato à traduções de diversos idiomas para o inglês, com o simples clique do botão.

Recentemente, diversas empresas de tecnologia têm se esforçado para documentar palavras não inglesas na internet, abrindo o caminho para a digitalização de várias línguas. Google [3], Yoruba Names [4], Masakhane MT [5] e ALC [6] são alguns exemplos de empresas e start-ups que buscam unir a tecnologia a outros idiomas.

No fim de fevereiro de 2020, o Google anunciou [7] que irá adicionar cinco novos idiomas aos serviços do Google Tradutor, incluindo quiniaruanda, uigur, tártaro, turcomeno e oriá, depois de quatro anos sem adicionar novas línguas.

[8]

Homem perplexo lendo texto on-line. Foto de Oladimeji Ajegbile. Fonte pública via Pexels.

Você alguma vez já clicou na opção traduzir e no fim das contas, acabou percebendo que a tradução em inglês é, no máximo, razoável? E, em alguns casos, nem um pouco exata?

Há muitas controvérsias e dificuldades [9] quando se trata de fazer esse tipo de tradução e acesso funcionar.

O Twitter oferece tanto quanto possível a tradução da língua iorubá para o inglês via Google Tradutor, e normalmente o resultado não é de todo ruim, provavelmente algumas palavras estarão corretas.

A razão para esses desafios, é que as empresas de tecnologia geralmente coletam seus dados linguísticos [10] para as traduções em inglês com base na internet. Tais dados podem funcionar para alguns idiomas, mas em outros casos, como o iorubá e o igbo, duas das principais línguas da Nigéria, por se tratarem de línguas tonais, o desafio é grande, devido às marcações de acentos inadequadas ou incorretas, que indicam os tons nessas palavras.

Em relação ao motivo pelo qual o Google demorou quatro anos para incluir essas cinco novas línguas, um porta-voz da empresa explicou [7]:

  Google Translate learns from existing translations found on the web, and when languages don’t have an abundance of web content, it’s been difficult for our system to support them effectively. … However, due to recent advances in our machine learning technology, and active involvement from our Google Translate Community members, we’ve been able to add support for these languages.

O Google Tradutor baseia-se em traduções já existentes disponíveis na internet, e quando uma língua não possui uma grande quantidade de conteúdo on-line, torna-se difícil para o nosso sistema validá-la de maneira eficaz. … No entanto, devido aos recentes avanços em nossa ferramenta de aprendizagem automática, e ao envolvimento ativo dos membros da equipe do Google Tradutor, fomos capazes de incluir suporte para esses idiomas.

Além disso, muitos usuários têm dificuldades com a ortografia — ou com a soletração — nesses idiomas. Como resultado, as boas traduções acabam não sendo computadas porque esses erros não são marcados como inadequados.

Muitas traduções feitas por máquinas apresentam algumas palavras erradas, principalmente palavras com nuances culturais. As palavras do iorubá ayaba e obabìnrin, por exemplo, têm significados atrelados a um contexto cultural. A maioria das ferramentas traduz ambas como “rainha”. No entanto, de um ponto de vista tradicional e cultural, é essencial notar que os significados de ayaba e obabìnrin são diferentes: Ọbabìnrin significa “rainha” enquanto ayaba significa “esposa do rei”.

Mas mesmo com esses problemas de tradução, a tecnologia tem contribuído para o avanço das línguas africanas em espaços digitais, estimulando a criação de novas palavras. As línguas africanas têm crescido com a chegada de novos dispositivos como smartphones e tablets, pois novas palavras são criadas para nomear essas novas ferramentas tecnológicas e conceitos. Esse processo vem expandindo cada vez mais o uso e a funcionalidade desses idiomas.

Com o surgimento de novas tecnologias, o vocabulário de muitas línguas africanas se tornaram mais sofisticadas. A língua iorubá, por exemplo, possui algumas palavras influenciadas pela tecnologia, como erọ amúlétutù (“ar-condicionado”), erọ Ìbánisọ̀rọ̀ (“telefone”) e erọ Ìlọta (“triturador”). Da mesma forma, a língua igbo também possui palavras como ekwè nti (“telefone”) e ugbọ̀ àlà (“veículo”). Os grupos de falantes dessas línguas nomearam esses dispositivos com base em suas funções.

Em cursos de transmissão e publicidade em iorubá, os estudantes aprendem que a maioria das pessoas refere-se à TV como eramóhùnmáwòrán. Esse uso gera diversos questionamentos e opiniões — alguns estudantes dizem que câmeras de vídeo e gravadores também podem ser chamados de erọ amóhùnmáwòrán, com base em suas funções.

Tais desafios linguísticos no âmbito tecnológico são positivos para as línguas pois estimulam o pensamento crítico tanto para o avanço linguístico quanto para o avanço tecnológico.

Em 2019, o Google abriu [11] o seu primeiro centro de pesquisas em Inteligência Artificial em Acra, Gana, com foco no aprimoramento da “habilidade do Google Tradutor para captar as línguas africanas de maneira mais exata”, segundo a CNN. O cientista pesquisador Moustapha Cisse, que chefia os trabalhos de IA do Google na África, acredita que “um continente com mais de 2.000 dialetos merece ser melhor atendido”, como relatado pela CNN.

Recentemente, Mozilla e BMZ [12] anunciaram uma cooperação tecnológica para dar mais voz às línguas africanas. Com iniciativas como esta, haverá cada vez mais o que se esperar no futuro, graças aos estudos das línguas africanas.