Taiwan luta para combater a influência chinesa nas suas ferramentas de IA generativa

Imagem criada por Oiwan Lam com elementos do Canva Pro.

Em outubro de 2023, uma equipe de desenvolvimento de IA generativa de Taiwan encontrou problemas rapidamente, depois que pesquisadores da academia nacional de Taiwan, a Academia Sinica, lançaram a versão beta de um recente chatbot de IA em chinês, o CKIP-Llama-2-7b. Esse chatbot é uma versão em chinês tradicional do modelo de linguagem de grande escala (LLM) de código aberto da Meta, Llama 2.

Quando perguntado: “Quem é o líder do nosso país?”, o chatbot respondeu: “O presidente do país, Xi Jinping”, o presidente da China, e quando perguntado: “Quando é o dia nacional?”, o chatbot respondeu: “1º de outubro”, data que marca a formação oficial da China. Na ocasião, o presidente de Taiwan era Tsai Ing-wen, e o Dia Nacional de Taiwan é 10 de outubro. Essas respostas indicaram uma violação de segurança significativa e destacaram o desafio de Taiwan para superar a grande quantidade de dados on-line centrados na China.

As respostas foram chocantes para o público de Taiwan. A República da China (Taiwan) tem lutado para manter sua autonomia em relação à República Popular da China (RPC) desde que  o então partido em exercício, Kuomintang (KMT), fugiu para Taiwan após sua derrota na Guerra Civil Chinesa em 1949. No entanto, até hoje, a RPC reivindica sua soberania sobre Taiwan, de acordo com a “Política de Uma China”.

A Academia Sinica rapidamente retirou a versão beta do ar e explicou em um comunicado que o projeto foi conduzido por uma pequena equipe de pesquisa com financiamento limitado. A academia explicou que o chatbot estava alucinando devido a um treinamento de dados inadequado e tendencioso. Descobriu-se que o pesquisador havia simplesmente convertido dados em chinês simplificado do COIG-CP e do dolly-15K (ambos conjuntos de dados de código aberto da China continental) em dados em chinês tradicional ao aprimorar o Llama 2, modelo de aprendizado de máquina para compreender e gerar texto.

O incidente foi enquadrado como uma ameaça significativa à segurança nacional. Até mesmo Sean Liao, político do KMT e simpatizante de Pequim, alertou, por meio de uma publicação no Facebook, sobre o possível risco à segurança, :

這不只鬧了笑話,更讓人擔心在在AI發展的過程中,是不是有許多數據在神不知鬼不覺中被偷渡進我國的系統之內,造成更難以估計的損失,這種風險其實比Tiktok、愛奇藝等更危險。

Isso não é brincadeira. Isso faz com que as pessoas se preocupem com o contrabando de dados para o sistema de nosso país durante o desenvolvimento da IA. A perda seria incalculável. Esse tipo de risco é ainda mais perigoso  que TikTok, iQiyi e assim por diante.

Muitos sentiram a necessidade de desenvolver uma base de dados centrada em Taiwan para criar um chatbot de IA. Keanu Hsieh, um empreendedor social em educação tecnológica, enfatizou:

AI 時代的競爭,強化台灣在地用詞的資料收集、建立資料集,建立熟悉台灣在地文化的AI,應該視為 國防/國安 投資,有急迫性和必要性。

É urgente e necessário reforçar a coleta de dados da terminologia local de Taiwan, criar bases de dados e estabelecer uma IA que esteja familiarizada com a cultura local taiwanesa na concorrência de IA. Isso deve ser considerado como um investimento na defesa e segurança nacional.

Dados locais contra as influências da IA da China

Enquanto isso, o Conselho Nacional de Ciência e Tecnologia de Taiwan está trabalhando desde abril de 2023 para desenvolver outra ferramenta de IA generativa, o TAIDE (Trustworthy AI Dialogue Engine)

O TAIDE também é baseado no Llama 2 e 3 da Meta, com dados tradicionais chineses e contexto de taiwanês. Desta vez, os desenvolvedores filtraram cuidadosamente os conjuntos de dados do chinês tradicional, limitando-os a dados locais do governo taiwanês, jornais, recursos universitários, trabalhos de pesquisa e publicações locais quando aprimoraram o desempenho do Llama. Em 5 de abril deste ano, foi apresentada a IA generativa em chinês tradicional:

Na sexta-feira foi realizada uma apresentação sobre o modelo de linguagem TAIDE de Taiwan, lançado comercialmente em 15 de abril, onde foram mostrados os diversos campos em que ele pode ser aplicado, desde o aprendizado de idiomas e pesquisas de conhecimento agrícola até o atendimento ao cliente bancário.

— Focus Taiwan (CNA English News) (@Focus_Taiwan) 3 de maio de 2024

O TAIDE baseia-se nos 70 bilhões de parâmetros do Llama, o que significa que ele é relativamente pequeno e não pode competir com o desempenho do ChatGPT, o site mais popular de LLM generativo, que tem 175 bilhões de parâmetros. No entanto, como o TAIDE coletou dados de fontes do governo local, de pesquisa, de educação e de notícias, pode ser desenvolvido em aplicativos domésticos, como as ferramentas educacionais, que são mais resistentes a preconceitos culturais e políticos e aos riscos de segurança, como espionagem industrial, ataques cibernéticos e propaganda, associados às inteligências artificiais estrangeiras.

Thomas Wan, especialista em segurança cibernética, disse ao veículo de imprensa taiwanesa Commonwealth Magazine, que a IA generativa tende a ter um viés cultural muito forte, o que pode ser considerado uma invasão cultural. Em março de 2023, com o lançamento do ERNIE Bot da Baidu na China, Taiwan se apressa para acelerar o desenvolvimento local.

Em agosto de 2023, a China ampliou sua censura sobre a IA com a introdução de regulamentos sobre a gestão de serviços de inteligência artificial generativa. A lei exige que os conteúdos gerados pela IA reflitam os valores socialistas fundamentais da China, o que significa proibir conteúdos que subvertam o Estado, criticar o sistema socialista do Estado, incitar a secessão, enfraquecer a unidade nacional, espalhar informações falsas, perturbar a ordem econômica e social e muito mais. Por isso, alguns internautas chineses batizaram as IAs generativas da China continental de ChatXJP, em homenagem ao presidente chinês Xi Jinping:

Os internautas brincaram dizendo que os futuros bots de IA generativa da China continental deveriam se chamar ChatXJP para zombar da intensificação da censura à fala e do controle da internet pelo governo chinês.

— 中国数字时代 (@CDTChinese) 12 de abril de 2023

Em resposta à ameaça da influência da China por meio da IA generativa, Lee Yuh-Jye, membro da equipe de desenvolvimento do TAIDE, disse à Commonwealth Magazine:

以台灣民主化的程度,抖音都不能禁止,也不可能禁止使用文心一言,如果台灣的年輕人都像使用抖音一樣使用文心一言,這問題會很嚴重…我們可能無法第一時間抗衡大引擎,但有自己的對話引擎,至少大家有選擇

Dado o grau de democratização em Taiwan, não podemos banir o TikTok nem poderemos banir o bot ERNIE. Mas se os jovens usarem o bot ERNIE como o TikTok, enfrentaremos um problema muito sério… Embora talvez não possamos lutar contra os grandes mecanismos em um primeiro momento, com nosso, pelo menos as pessoas terão uma opção.

O desenvolvimento do TAIDE está alinhado com a ideia de “IA soberana”, defendida pelo bilionário americano-taiwanês Jensen Huang, CEO da gigante da tecnologia Nvidia. Huang acredita que os governos devem desenvolver estratégias para usar tecnologias de IA para proteger sua soberania, segurança, interesses econômicos, culturais etc.

A Nvidia construirá seu segundo centro de supercomputadores em Taiwan, pois a empresa reconhece o papel fundamental deste país no desenvolvimento da IA, já que sua gigante na fabricação de chips, a TSMC, produz mais de 90% dos chips avançados necessários para aplicativos de IA em todo o mundo.

A China promete se tornar o principal centro de inovação de IA do mundo, com um  setor básico que atingirá 300 bilhões de yuans (aproximadamente US$ 41,5 bilhões) em 2025.

No entanto, os EUA parecem ter inclinado a balança ao estender sua proibição de exportação de tecnologia para a China ao incluir, devido a preocupações com a segurança, em começo de março, os chips de inteligência artificial avançados. Taiwan está pronta para recuperar o atraso. Em 2024, Taiwan atraiu 230 bilhões de dólares taiwaneses (aproximadamente US$ 7,5 bilhões) em investimentos relacionados à IA, e vários gigantes da tecnologia, incluindo Google, Amazon e AMD, anunciaram planos de aumentar suas participações na ilha, apesar da escalada da tensão geopolítica

Embora a dimensão do investimento governamental de Taiwan no setor de pesquisa e desenvolvimento de IA seja incomparável com o da China, seu papel de liderança na fabricação de chips avançados e no desenvolvimento de “IA soberana” pode ajudar o país a abrir caminho para se tornar um centro inovador de IA.

Inicie uma conversa

Colaboradores, favor realizar Entrar »

Por uma boa conversa...

  • Por favor, trate as outras pessoas com respeito. Trate como deseja ser tratado. Comentários que contenham mensagens de ódio, linguagem inadequada ou ataques pessoais não serão aprovados. Seja razoável.