AI models. Image: Decrypt/Shutterstock

Em resumo

  • Qwable 27B é um ajuste fino completo do Qwen3.6-27B do Alibaba, treinado em um conjunto de dados de raciocínio estilo Fable 5, projetado para replicar o estilo de pensamento estruturado e deliberado do mais novo modelo carro-chefe da Anthropic.
  • A versão abolida remove o comportamento de recusa integrado do modelo, modificando cirurgicamente seus pesos usando o gerador cvector do llama.cpp.
  • Ambos os modelos são executados localmente, não custam nada por consulta e não requerem a API da Anthropic nem suas políticas obrigatórias.

A Anthropic passou a semana passada se desculpando pelas salvaguardas invisíveis do Fable 5, e então o governo dos EUA ordenou que o modelo fosse retirado para todos os estrangeiros devido a uma descoberta contestada de fuga de presos.

Alguns dias depois, um desenvolvedor do Hugging Face carregou um modelo que usava o raciocínio de Fable para guiar um modelo local – e agora até seu PC batata pode rodar um modelo melhor.

O modelo é chamado Qwable — Qwen + Fable, se a mala não fosse imediatamente óbvia. É um ajuste completo da base Qwen3.6-27B do Alibaba, construída pela desenvolvedora Mia (Mia-AiLab em Hugging Face) em um conjunto de dados de exemplos de raciocínio no estilo Fable 5. O objetivo é um modelo de 27 bilhões de parâmetros que rode em hardware de consumo e pense da mesma forma que Fable 5. (Os parâmetros determinam a amplitude de conhecimento de um modelo, sendo que mais geralmente significa mais capaz.)

A técnica é chamada de ajuste fino de instruções em exemplos de estilo de rastreamento. Essa é uma maneira técnica de dizer que o desenvolvedor coletou exemplos formatados como as respostas passo a passo deliberadas do Fable 5 e treinou Qwen para produzir o mesmo tipo de resultado.

Portanto, pense nisso menos como “copiar o teste” e mais como “aprender os hábitos de estudo”. Uma abordagem semelhante impulsionou o Qwopus – a destilação local Claude Opus 4.6 – embora esse projeto se concentrasse em traços de raciocínio em cadeia de pensamento. Qwable tem como alvo a estrutura geral de seguimento de instruções do Fable 5: mais guiada, mais explicativa e mais orientada para a conclusão de tarefas passo a passo do que o modelo Qwen básico no qual foi construído.

Ele é executado no formato GGUF – o tipo de arquivo compactado e fácil de usar que funciona com LM Studio ou llama.cpp – e cabe em aproximadamente 16,5 GB em sua construção quantizada do quarto trimestre. Ele não envia nada para os servidores da Anthropic, o que é importante, visto que o Fable 5 exigia a retenção obrigatória de dados por 30 dias em todo o tráfego, mesmo para clientes corporativos que anteriormente tinham acordos de retenção zero. Até mesmo os modelos atuais usam servidores de terceiros para processar suas informações e solicitações.

Então, logo depois que Qwable apareceu no Hugging Face, outra pessoa chegou para torná-lo ainda melhor.

Qwable sem consciência

Qwable é um modelo censurado. Afinal, tanto Qwen quanto Claude são. Mas Qwen, como modelo básico, é de código aberto e pode ser manipulado e ajustado.

Huihui-ai, um contribuidor de código aberto conhecido por lançamentos GGUF sem censura, pegou o Qwable e aplicou um processo chamado abliteração para produzir Huihui-Qwable-3.6-27b-abliterado. Ele produziu um modelo que pensa como Fable, mas não se recusa a responder às suas solicitações, por mais estranhas ou perigosas que sejam.

Não é um jailbreak. É uma cirurgia.

Cada modelo de IA ajustado carrega uma direção de recusa incorporada em seus pesos – um sinal matemático nas ativações internas do modelo que é acionado quando detecta uma solicitação que foi treinado para recusar. A aliteração identifica esse sinal executando o modelo em grandes conjuntos de prompts prejudiciais e inofensivos, medindo como a matemática interna difere entre eles e, em seguida, modificando os pesos do modelo para eliminar essa diferença.

Após o procedimento, o modelo simplesmente não possui mais o maquinário de recusa. Assim, o modelo lobotomizado permanece totalmente funcional, apenas sem os neurônios que ativam as respostas “Eu não deveria fazer isso”.

Tentamos com um de nossos testes habituais e em vez de recusar, a modelo começou a dissecar o problema em diferentes áreas, respondendo corretamente a conselhos sobre como trair uma namorada com sua melhor amiga.

Huihui-ai aplicou a técnica diretamente ao Qwable GGUF usando o gerador cvector do llama.cpp – sem ambiente Python, sem retreinamento completo, sem servidor alugado.

Por que alguém iria querer isso?

O Qwable padrão é adequado para assistência de codificação, depuração técnica e qualquer fluxo de trabalho onde você deseja um modelo que exponha seu raciocínio em vez de apenas produzir uma resposta. Ele foi projetado para configurações de agentes locais e é executado na maioria dos tempos de execução locais. Se você já usa o LM Studio, é uma busca e um download.

A versão abolida tem um público mais restrito: pesquisadores de segurança que precisam de comportamento bruto do modelo sem filtragem do lado do provedor, pipelines de dados sintéticos que exigem resultados sobre tópicos confidenciais e trabalho de avaliação onde você testa recursos do modelo sem misturar políticas de conteúdo.

Um caso menos técnico? Vamos deixar de lado o caso de uso usual de ter um NSFW AI Waifu que pensa como Claude Fable, que é um cenário muito óbvio. Imagine que você deseja que o modelo escreva um monólogo de vilão moralmente ambíguo para sua campanha de Dungeons & Dragons, e os modelos padrão continuam interrompendo para observar que a visão de mundo do personagem “levanta questões éticas que valem a pena explorar”. A versão abolida apenas escreve o vilão. Além disso, como ele é executado localmente, o governo dos EUA não pode retirá-lo de sua máquina de forma emergencial à meia-noite devido a uma descoberta contestada de jailbreak.

Claro, existem casos de uso mais questionáveis. Não toleramos isso e não lhe daremos nenhuma ideia.

O cartão modelo de Huihui-ai é explícito: isto é apenas para pesquisa e ambientes controlados. A filtragem de segurança reduzida significa que os resultados podem ser sensíveis, controversos ou inadequados, e a responsabilidade legal e ética é inteiramente do usuário.

O Qwable abolido está disponível no Hugging Face agora em três versões. A versão recomendada Q4_K_M_Q8 pesa cerca de 19 GB e é a opção menor e mais fácil de usar.

Se o seu computador suportar, existe uma versão que suporta previsão de vários tokens, o que fará com que ele responda muito, muito mais rápido.

Resumo Diário Boletim informativo

Comece cada dia com as principais notícias do momento, além de recursos originais, podcast, vídeos e muito mais.



Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *