Conheça Qwable: o modelo local gratuito que pensa como Claude Fable

Em resumo

Qwable 27B é um ajuste fino completo do Qwen3.6-27B do Alibaba, treinado em um conjunto de dados de raciocínio estilo Fable 5, projetado para replicar o estilo de pensamento estruturado e deliberado do mais novo modelo carro-chefe da Anthropic.
A versão abolida remove o comportamento de recusa integrado do modelo, modificando cirurgicamente seus pesos usando o gerador cvector do llama.cpp.
Ambos os modelos são executados localmente, não custam nada por consulta e não requerem a API da Anthropic nem suas políticas obrigatórias.

A Anthropic passou a semana passada se desculpando pelas salvaguardas invisíveis do Fable 5, e então o governo dos EUA ordenou que o modelo fosse retirado para todos os estrangeiros devido a uma descoberta contestada de fuga de presos.

Alguns dias depois, um desenvolvedor do Hugging Face carregou um modelo que usava o raciocínio de Fable para guiar um modelo local – e agora até seu PC batata pode rodar um modelo melhor.

O modelo é chamado Qwable — Qwen + Fable, se a mala não fosse imediatamente óbvia. É um ajuste completo da base Qwen3.6-27B do Alibaba, construída pela desenvolvedora Mia (Mia-AiLab em Hugging Face) em um conjunto de dados de exemplos de raciocínio no estilo Fable 5. O objetivo é um modelo de 27 bilhões de parâmetros que rode em hardware de consumo e pense da mesma forma que Fable 5. (Os parâmetros determinam a amplitude de conhecimento de um modelo, sendo que mais geralmente significa mais capaz.)

Então eu fiz uma coisa.

Treinei Qwen 3.6 27b com o raciocínio Fable 5.
Os resultados são… interessantes.

Vou comparar os dois lado a lado.

Alguém estaria interessado em testá-lo? Posso fazer upload de um gguf em hf. pic.twitter.com/hQCiUlT1sr

-Mia (@MiaAI_lab) 15 de junho de 2026

A técnica é chamada de ajuste fino de instruções em exemplos de estilo de rastreamento. Essa é uma maneira técnica de dizer que o desenvolvedor coletou exemplos formatados como as respostas passo a passo deliberadas do Fable 5 e treinou Qwen para produzir o mesmo tipo de resultado.

Portanto, pense nisso menos como “copiar o teste” e mais como “aprender os hábitos de estudo”. Uma abordagem semelhante impulsionou o Qwopus – a destilação local Claude Opus 4.6 – embora esse projeto se concentrasse em traços de raciocínio em cadeia de pensamento. Qwable tem como alvo a estrutura geral de seguimento de instruções do Fable 5: mais guiada, mais explicativa e mais orientada para a conclusão de tarefas passo a passo do que o modelo Qwen básico no qual foi construído.

Ele é executado no formato GGUF – o tipo de arquivo compactado e fácil de usar que funciona com LM Studio ou llama.cpp – e cabe em aproximadamente 16,5 GB em sua construção quantizada do quarto trimestre. Ele não envia nada para os servidores da Anthropic, o que é importante, visto que o Fable 5 exigia a retenção obrigatória de dados por 30 dias em todo o tráfego, mesmo para clientes corporativos que anteriormente tinham acordos de retenção zero. Até mesmo os modelos atuais usam servidores de terceiros para processar suas informações e solicitações.

Então, logo depois que Qwable apareceu no Hugging Face, outra pessoa chegou para torná-lo ainda melhor.

Qwable sem consciência

Qwable é um modelo censurado. Afinal, tanto Qwen quanto Claude são. Mas Qwen, como modelo básico, é de código aberto e pode ser manipulado e ajustado.

Huihui-ai, um contribuidor de código aberto conhecido por lançamentos GGUF sem censura, pegou o Qwable e aplicou um processo chamado abliteração para produzir Huihui-Qwable-3.6-27b-abliterado. Ele produziu um modelo que pensa como Fable, mas não se recusa a responder às suas solicitações, por mais estranhas ou perigosas que sejam.

Não é um jailbreak. É uma cirurgia.

Cada modelo de IA ajustado carrega uma direção de recusa incorporada em seus pesos – um sinal matemático nas ativações internas do modelo que é acionado quando detecta uma solicitação que foi treinado para recusar. A aliteração identifica esse sinal executando o modelo em grandes conjuntos de prompts prejudiciais e inofensivos, medindo como a matemática interna difere entre eles e, em seguida, modificando os pesos do modelo para eliminar essa diferença.

Após o procedimento, o modelo simplesmente não possui mais o maquinário de recusa. Assim, o modelo lobotomizado permanece totalmente funcional, apenas sem os neurônios que ativam as respostas “Eu não deveria fazer isso”.

Tentamos com um de nossos testes habituais e em vez de recusar, a modelo começou a dissecar o problema em diferentes áreas, respondendo corretamente a conselhos sobre como trair uma namorada com sua melhor amiga.

Huihui-ai aplicou a técnica diretamente ao Qwable GGUF usando o gerador cvector do llama.cpp – sem ambiente Python, sem retreinamento completo, sem servidor alugado.

Por que alguém iria querer isso?

O Qwable padrão é adequado para assistência de codificação, depuração técnica e qualquer fluxo de trabalho onde você deseja um modelo que exponha seu raciocínio em vez de apenas produzir uma resposta. Ele foi projetado para configurações de agentes locais e é executado na maioria dos tempos de execução locais. Se você já usa o LM Studio, é uma busca e um download.

A versão abolida tem um público mais restrito: pesquisadores de segurança que precisam de comportamento bruto do modelo sem filtragem do lado do provedor, pipelines de dados sintéticos que exigem resultados sobre tópicos confidenciais e trabalho de avaliação onde você testa recursos do modelo sem misturar políticas de conteúdo.

Um caso menos técnico? Vamos deixar de lado o caso de uso usual de ter um NSFW AI Waifu que pensa como Claude Fable, que é um cenário muito óbvio. Imagine que você deseja que o modelo escreva um monólogo de vilão moralmente ambíguo para sua campanha de Dungeons & Dragons, e os modelos padrão continuam interrompendo para observar que a visão de mundo do personagem “levanta questões éticas que valem a pena explorar”. A versão abolida apenas escreve o vilão. Além disso, como ele é executado localmente, o governo dos EUA não pode retirá-lo de sua máquina de forma emergencial à meia-noite devido a uma descoberta contestada de jailbreak.

Claro, existem casos de uso mais questionáveis. Não toleramos isso e não lhe daremos nenhuma ideia.

O cartão modelo de Huihui-ai é explícito: isto é apenas para pesquisa e ambientes controlados. A filtragem de segurança reduzida significa que os resultados podem ser sensíveis, controversos ou inadequados, e a responsabilidade legal e ética é inteiramente do usuário.

O Qwable abolido está disponível no Hugging Face agora em três versões. A versão recomendada Q4_K_M_Q8 pesa cerca de 19 GB e é a opção menor e mais fácil de usar.

Se o seu computador suportar, existe uma versão que suporta previsão de vários tokens, o que fará com que ele responda muito, muito mais rápido.

Resumo Diário Boletim informativo

Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.

Fontedecrypt

Conheça Qwable: o modelo local gratuito que pensa como Claude Fable

ByJose Antonio Lanz

Em resumo

Qwable sem consciência

Por que alguém iria querer isso?

Resumo Diário Boletim informativo

By Jose Antonio Lanz

Leia Também

Mark Zuckerberg também quer um mercado de previsões: NYT

BitGo se junta à onda de demissões de IA da Crypto, reduzindo funcionários em 15%

A Lei de Clareza da Crypto tem um novo inimigo: líderes católicos

Deixe um comentário Cancelar resposta

Leia Também:

Mark Zuckerberg também quer um mercado de previsões: NYT

BitGo se junta à onda de demissões de IA da Crypto, reduzindo funcionários em 15%

A Lei de Clareza da Crypto tem um novo inimigo: líderes católicos

O impulso quântico de Trump é elogiado, mas especialistas alertam que o Bitcoin não está pronto