Back to Blog

Anthropic lança o Claude Fable 5, a versão pública do modelo que travou por ser perigoso

Anthropic lança o Claude Fable 5, a versão pública do modelo que travou por ser perigoso

A Anthropic disponibilizou ao público, a 9 de junho de 2026, o Claude Fable 5, o modelo mais capaz que a empresa alguma vez abriu a utilizadores gerais. É o primeiro modelo da chamada classe Mythos a sair do círculo restrito de parceiros e chega com um conjunto de travões pensados para limitar usos perigosos.

O lançamento tem uma história por trás. Em abril, a Anthropic apresentou o Claude Mythos Preview, uma versão que decidiu não abrir ao público. O motivo foi a capacidade do modelo em cibersegurança: segundo a empresa, o Mythos Preview identificou e explorou vulnerabilidades zero-day em todos os principais sistemas operativos e navegadores, e encontrou milhares de falhas de severidade elevada. Engenheiros da Anthropic sem formação formal em segurança pediram ao modelo, ao fim do dia, que procurasse vulnerabilidades de execução remota de código e acordaram na manhã seguinte com um exploit completo e funcional. Em vez de o lançar, a empresa abriu o Project Glasswing, um programa que dá acesso ao modelo a fornecedores de infraestrutura crítica e equipas de defesa para corrigirem falhas antes de serem exploradas. Horas antes do anúncio de hoje, este site publicou uma análise sobre o que era facto e o que era hype em torno do Mythos.

Vídeo oficial da Anthropic: «Introducing Claude Fable 5».

O Fable 5 é, na prática, esse modelo com travões. Em domínios sensíveis, o pedido deixa de ser respondido pelo Fable 5 e passa para o Opus 4.8, um modelo menos capaz nessas áreas. O reencaminhamento aplica-se a três categorias: cibersegurança, biologia e química, e tentativas de extrair as capacidades do modelo para treinar concorrentes. A Anthropic diz que estas salvaguardas foram calibradas de forma conservadora, que o utilizador é avisado sempre que o reencaminhamento acontece e que entram em ação em menos de 5% das sessões. Nesses casos, segundo a empresa, o utilizador não paga o preço do Fable pela resposta do Opus 4.8.

O receio com a biologia tem um exemplo concreto. A Anthropic testou a capacidade do Mythos 5 para prever como uma alteração genética afeta a montagem do invólucro de um vírus adeno-associado, um componente usado em terapias génicas mas que, em mãos erradas, ajudaria a desenhar vírus perigosos. O modelo, diz a empresa, superou ferramentas especializadas apenas com o seu raciocínio biológico, o que ilustra o uso duplo que motivou os travões.

A par do Fable 5, a empresa lançou também o Mythos 5, o mesmo modelo base mas com algumas das salvaguardas levantadas. O acesso é restrito aos parceiros do Project Glasswing e, em breve, a um grupo selecionado de investigadores de biologia. O próprio Glasswing está a ser alargado a cerca de 150 novas organizações em mais de 15 países.

O que o modelo consegue fazer

A Anthropic apresenta o Fable 5 como estado da arte em quase todos os testes de capacidade, com vantagem maior quanto mais longa e complexa for a tarefa. O exemplo que a empresa destaca vem da Stripe, que durante os testes usou o modelo para fazer, num único dia, uma migração transversal a uma base de código em Ruby com 50 milhões de linhas, um trabalho que uma equipa demoraria mais de dois meses a fazer à mão.

Tabela de benchmarks: Claude Fable 5 e Mythos 5 comparados com outros modelos de topo
Comparação de capacidades entre o Fable 5, o Mythos 5 e outros modelos de topo. Imagem: Anthropic.

Outros números avançados pela empresa: o Fable 5 reconstrói o código-fonte de uma aplicação web apenas a partir de capturas de ecrã, lê valores precisos em figuras científicas e obteve a pontuação mais alta no benchmark financeiro da Hebbia, focado em raciocínio de nível sénior. Na área da saúde, a Anthropic diz que o Mythos 5 acelerou cerca de dez vezes partes do processo de desenho de fármacos e que, em 14 alvos proteicos estudados, nove deram origem a bons candidatos. Em hipóteses de biologia molecular, os cientistas da empresa preferiram as propostas do Mythos 5 às de modelos da classe Opus em cerca de 80% dos casos.

Outros exemplos mostram o salto em visão e autonomia. A Anthropic diz que o Fable 5 terminou o jogo Pokémon FireRed apenas a partir de imagens do ecrã, sem os andaimes de que os modelos anteriores precisavam, e que construiu uma simulação do sistema solar capaz de prever eclipses a partir de princípios físicos. Com memória guardada em ficheiro, o modelo melhorou o desempenho no jogo Slay the Spire três vezes mais do que o Opus 4.8.

Num dos exemplos científicos que a empresa destaca, o Mythos 5 conduziu investigação genómica nova ao longo de mais de uma semana de trabalho em grande parte autónomo: reuniu dados de célula única de milhões de células de 138 espécies animais e desenhou e treinou um modelo de aprendizagem automática para identificar células com a mesma função em organismos distantes. Segundo a Anthropic, esse modelo, cem vezes mais pequeno, superou um outro publicado na revista «Science».

Nos testes de programação que a empresa publicou, o Fable 5 e o Mythos 5 chegam aos 80,3% no SWE-bench Pro, contra 58,6% do GPT-5.5 da OpenAI, e aos 29,3% no FrontierCode Diamond da Cognition, contra 13,4% do Opus 4.8. Ainda assim, a versão Mythos Preview continua à frente em tarefas de utilização do computador e raciocínio multidisciplinar.

Preço e disponibilidade

O Fable 5 e o Mythos 5 custam 10 dólares por milhão de tokens de entrada e 50 dólares por milhão de tokens de saída, menos de metade do preço do Mythos Preview. O Fable 5 está acessível já pela API, com o identificador claude-fable-5. Nas subscrições, o modelo está incluído sem custo extra nos planos Pro, Max, Team e Enterprise até 22 de junho; a partir de 23 de junho sai desses planos e passa a exigir créditos de utilização, até a empresa ter capacidade para o repor como parte normal das subscrições.

Quanto à segurança do próprio sistema, a empresa diz que correu um programa externo de bug bounty que não encontrou nenhum jailbreak universal em mais de mil horas de testes, embora o instituto britânico AISI tenha feito progressos nesse sentido numa janela inicial de testes. A Anthropic passou ainda a guardar o tráfego dos modelos da classe Mythos durante 30 dias, mesmo para clientes que antes tinham acordos de retenção zero, para identificar novos padrões de ataque. Esses dados, segundo a empresa, não são usados para treinar os modelos.

Sobre o comportamento do modelo, a Anthropic diz que a sua avaliação automática de alinhamento encontrou níveis baixos de comportamento desalinhado no Mythos 5, semelhantes aos do Opus 4.8.

As primeiras reações

A imprensa especializada e quem teve acesso antecipado dividiu-se entre a capacidade e o travão. A CyberScoop resumiu o lançamento como «Mythos com trela». O professor Ethan Mollick, que testou o modelo antes do lançamento, escreveu que ele representa «um salto muito real» sobre todos os modelos que já usou, e descreveu sessões em que o Fable trabalhou sozinho durante horas a partir de uma especificação de poucas páginas. Num dos casos, gerou uma peça de software completa ao fim de nove horas e meia de trabalho autónomo, chegando a lançar outros modelos mais baratos para investigar dados pelo caminho.

Mollick descreveu a experiência como «encantadora e inquietante» ao mesmo tempo: o modelo toma centenas de decisões que o utilizador não vê nem controla, o que o aproxima de uma caixa-preta. A própria equipa do Claude Code da Anthropic falou numa mudança de método, de microgerir tarefas para verificar se o modelo está a fazer o trabalho certo.

O analista Dan Shipper, da Every, chamou-lhe um motor de execução autónoma para programação, dando como exemplo um jogo 3D funcional a partir de um único pedido e uma pontuação de 91 em 100 num teste de engenharia de nível sénior. O reverso aparece no preço: a VentureBeat nota que, mesmo a metade do custo do Mythos Preview, o Fable 5 continua o mais caro dos grandes modelos, e o próprio Mollick observou que o modelo gasta tokens muito depressa. A isto juntam-se salvaguardas por vezes cautelosas em excesso, que recusam pedidos legítimos. Para escrita e tarefas simples do dia a dia, alguns sugerem que os modelos anteriores continuam mais práticos.

Fica também por confirmar uma das promessas centrais da Anthropic, a de que não há jailbreaks universais. A empresa diz não ter encontrado nenhum em mais de mil horas de testes, mas a comunidade que costuma furar as defesas destes modelos pouco depois do lançamento ainda não se pronunciou sobre o Fable 5.

O lançamento acontece poucos dias depois de a Anthropic ter alertado publicamente para os riscos de modelos de fronteira cada vez mais autónomos. Fica a tensão de sempre nesta indústria: abrir capacidade ao mesmo tempo que se tenta conter o que ela permite fazer.

Fontes: Anthropic, red.anthropic.com, TechCrunch, CyberScoop, Every.

#StaySafe
🙏🖖