Em resumo
- Novos estudos estilométricos identificam padrões recorrentes na prosa de IA, incluindo ritmo previsível, sentimento uniforme e baixa variedade lexical.
- Uma análise do Washington Post de 328.744 mensagens do ChatGPT revela uma forte dependência de emojis, palavras favoritas e o clichê de “Não apenas X, mas Y”.
- O vocabulário evolui rapidamente, mas hábitos estruturais como simetria, organização e paralelismo negativo persistem através das gerações de modelos.
Tudo é escrito pela IA hoje em dia? Este artigo é?
A proliferação de grandes modelos linguísticos provocou uma nova e cautelosa literacia: as pessoas podem agora ler um parágrafo e perguntar-se quem – ou o quê – o escreveu. Essa ansiedade existe por um bom motivo.
Estudos recentes continuam a mostrar que a inundação cada vez maior de prosa gerada por máquinas difere da escrita humana de formas cada vez menos subtis, desde a escolha de palavras específicas até tiques estruturais facilmente identificáveis. Esses padrões são importantes porque afetam muito mais do que redações escolares e teses de pesquisa; eles moldam as comunicações corporativas, o jornalismo e o e-mail interpessoal de maneiras que podem confundir a confiança ou a autenticidade.
Pesquisadores que pesquisaram técnicas de detecção estilométrica encontraram padrões consistentes e mensuráveis na variedade lexical, estrutura de cláusulas e distribuições de palavras funcionais – uma impressão digital estatística que persiste em tarefas e prompts. Embora essas informações estejam diminuindo a cada geração de modelo – a OpenAI apenas corrigiu sua dependência excessiva de travessões, por exemplo – a diferença entre resíduos de IA e coisas escritas por humanos ainda é grande o suficiente para informar como leitores e editores abordam textos suspeitosamente polidos.
Um recente Washington Post a análise de 328.744 mensagens ChatGPT reforça este ponto com dados do mundo real. Descobriu-se que o modelo se baseia fortemente em emojis, em uma paleta estreita de palavras favoritas e no ditado favorito de todos, “paralelismo negativo: “Não é X, é Y;” ou “É menos sobre X e mais sobre Y.”
O Publicar também alertou contra o excesso de confiança: nenhuma dessas características prova a autoria da IA; eles apenas aumentam a probabilidade. Ainda assim, quando um texto apresenta vários deles, o sinal fica mais difícil de ignorar.
Aqui estão os cinco sinais mais fortes de que um texto pode ter sido gerado por máquina, cada um ancorado em pesquisas atuais.
Os 5 sinais de IA mais comuns
-
Paralelismo negativo e contraste simplificado
A IA abusa da dobradiça pura e dramática de “Não é X, é Y” e de seu primo, “não apenas X, mas Y”. Essas estruturas criam a ilusão de insight, ao mesmo tempo que fornecem muito pouco. Estudos estilométricos mostram que os resultados do LLM tendem a estruturas oracionais equilibradas e estereotipadas, em vez dos ritmos intuitivos e desiguais que os escritores humanos usam. No PublicarDe acordo com o conjunto de dados de julho, variações de “não apenas X, mas Y” apareceram em cerca de 6% de todas as mensagens de julho – uma porcentagem surpreendente para um único tique retórico.
-
Estrutura excessivamente organizada e ritmo visivelmente consistente
O texto gerado pelo LLM geralmente parece ter sido escrito por alguém que revisa compulsivamente, mas nunca improvisa. Os parágrafos seguem os padrões dos livros didáticos, as transições são sem atrito e a cadência é quase matematicamente uniforme, de acordo com uma análise recente em Natureza. A escrita humana – mesmo a escrita cuidadosa – normalmente reflete digressões, interrupções, mudanças tonais e ritmo assimétrico. O trabalho estilométrico que compara os resultados do LLM com contos humanos descobre que os modelos exibem uma variação muito mais estreita no comprimento das frases e na forma sintática.
-
Tom emocional suavizado e cobertura excessivamente cortês
A IA tende a parecer amigável de uma forma que nenhum adulto realmente parece, a menos que trabalhe no RH ou no suporte ao cliente. Frases como “É compreensível que…” ou finais que resumem tudo suavemente (“Em última análise…”) aparecem com uma regularidade anormal. Revisões quantitativas dos métodos de detecção observam que a prosa gerada pelo LLM exibe um sentimento mais uniforme e menos modulações emocionais abruptas do que o texto humano.
-
Abstrações vagas e vocabulário “seguro” em evolução
Os modelos dependem fortemente de substantivos genéricos – “ecossistema”, “estrutura”, “dinâmico” – e verbos como “alavancar”, “desbloquear” ou “navegar” quando ficam sem detalhes. Os estudos mostram consistentemente menor diversidade lexical e nominalização mais pesada em textos de IA. O Washington Post e Natureza as análises também descobriram que certos clichês de IA não são estáticos: o infame “aprofundamento” desapareceu em grande parte, substituído por novos favoritos como “principal” e “moderno”. Isso é importante porque o vocabulário evolui rapidamente; estrutura é mais confiável do que qualquer lista fixa de palavras.
-
Orações equilibradas e formulação visivelmente cuidadosa
Os LLMs adoram simetria: “Embora X seja verdadeiro, Y também é importante” ou “Seja você um iniciante ou um especialista…” Essas estruturas parecem seguras porque evitam compromissos. Estudos estilométricos mostram que o texto de IA abusa de certos padrões de palavras funcionais e construções de cláusulas em taxas que diferem acentuadamente das linhas de base humanas. Os humanos tendem a ser mais abruptos ou mais discursivos; as máquinas buscam sempre o equilíbrio diplomático.
A propósito, a maior parte deste artigo foi escrita pela IA.
Geralmente inteligente Boletim informativo
Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.
Fontedecrypt




