Daniel Abraham, um engenheiro informático de 28 anos, começou a receber mensagens de estranhos no WhatsApp. A culpa não era de uma fuga de dados nem de um site pirateado. Era do Gemini, o assistente de inteligência artificial da Google, que andava a dar o número de telemóvel pessoal dele como se fosse a linha de apoio ao cliente de uma empresa. Abraham avisou a Google a 17 de março. A resposta chegou a 4 de maio.
O caso dele não é um acidente isolado, é um sintoma. Estes assistentes não vão «procurar» a informação a lado nenhum no instante em que respondem. Foram treinados a engolir enormes quantidades de texto raspado da internet, e no meio desse texto vão dados reais de pessoas reais. O modelo memoriza-os e, quando calha, cospe-os de volta a quem perguntar. O problema de fundo é este: podes apagar uma linha numa base de dados, mas não consegues chegar lá dentro de um modelo e arrancar o teu número. A tua vida entrou lá, e a máquina não a sabe esquecer.
Não é só o número
Uma doutoranda da Universidade de Washington, Meira Gilbert, pediu ao Gemini o contacto de uma colaboradora, Yael Eiger, e o assistente devolveu-lhe o número de telemóvel pessoal de uma amiga dela. «Foi chocante», resumiu. E o dano não se fica pelos contactos. Quando o norueguês Arve Hjalmar Holmen perguntou ao ChatGPT o que sabia sobre si, recebeu uma história de terror inventada, a de que teria assassinado dois dos filhos e tentado matar o terceiro, e que cumpria 21 anos de prisão, tudo misturado com factos verdadeiros da vida dele, o número e o sexo dos filhos e o nome da terra. Em março de 2025, a associação de privacidade noyb apresentou queixa por violação do RGPD, o regulamento europeu de proteção de dados, por o sistema produzir informação falsa sobre uma pessoa identificável. A IA não se limita a deixar escapar dados verdadeiros. Também cola mentiras graves a nomes reais.
Porque é que a máquina não esquece
Quem estuda isto sabe há anos que não é um defeito pontual. Uma equipa liderada pelo investigador Nicholas Carlini conseguiu extrair de um modelo antigo, o GPT-2, sequências inteiras de texto memorizado, com nomes, números de telefone e emails verdadeiros. Mostraram depois que a memorização cresce com o tamanho do modelo de forma previsível e quase proporcional, em que aumentar o modelo dez vezes faz subir o que ele decora em cerca de 19 pontos. Por outras palavras, quanto mais capaz é o assistente que toda a gente corre a adotar, mais pedaços da tua vida ele consegue repetir.
E aqui está o nó que a lei ainda não desatou. O RGPD dá-te o direito ao esquecimento, o direito a exigir que apaguem os teus dados. Só que esse direito foi escrito a pensar em registos que se apagam, e um facto memorizado por um modelo não está numa gaveta, está diluído por milhares de milhões de parâmetros. Em Portugal, a Comissão Nacional de Proteção de Dados já pôs o dedo na ferida. João Osório, da CNPD, perguntou em voz alta: «Como é que asseguramos o direito ao esquecimento na IA generativa, se os dados já foram usados para treinar os modelos?» A própria Comissão chegou a propor que se excluíssem certos nomes e perfis dos resultados gerados por IA. É o reconhecimento oficial de que a tecnologia correu à frente da lei.
Como te proteges
Não podes limpar o interior de um modelo, mas podes reduzir a tua exposição e conhecer os teus direitos. O que ajuda:
- Reduz a tua pegada nos corretores de dados. Muito do que a IA memorizou veio de empresas que compram e vendem dados pessoais. Pede a remoção nas que te listam e usa as ferramentas de «resultados sobre ti» dos motores de busca.
- Exerce os teus direitos. O RGPD dá-te o direito a exigir correção ou apagamento. Se um assistente publica algo teu falso ou privado, reclama junto do fornecedor e, se preciso, queixa-te à CNPD.
- Não alimentes a máquina. Não escrevas em chatbots dados pessoais teus ou de terceiros, porque o que lá entra pode ficar retido.
- Desconfia do que a IA «sabe» sobre pessoas. Um nome acompanhado de uma afirmação não é prova. Trata a resposta de um assistente sobre alguém como um boato, não como um registo.
Habituámo-nos a poder apagar uma fotografia, fechar uma conta, mudar de número. Com estes modelos a lógica inverteu-se, porque os teus dados podem estar lá dentro, ao alcance de quem perguntar, e tirá-los de lá deixou de ser um clique teu para passar a ser um problema por resolver de quem construiu a máquina. Enquanto não o resolverem, a memória é deles e o incómodo é teu.
Fontes: MIT Technology Review, noyb.
#StaySafe
🙏🖖