Decrypt logoArtificial intelligence. Image: Shutterstock/Decrypt

Em resumo

  • O Alibaba atualizou o Qwen Deep Research com página da web com um clique e geração de podcast.
  • Nos testes, Qwen e Gemini empataram em precisão, superando ChatGPT e Grok
  • No geral, Qwen venceu em profundidade de pesquisa e produção web compartilhável, enquanto Gemini liderou em qualidade multimídia

Qwen, o grupo dedicado de pesquisa de IA da gigante tecnológica chinesa Alibaba, lançou uma atualização significativa para seu chatbot de IA na semana passada, permitindo aos usuários gerar documentos de pesquisa abrangentes sobre qualquer tópico.

Você pode então converter facilmente esses documentos em páginas da web limpas ou podcasts com vários alto-falantes com apenas alguns cliques.

Qwen Chat é semelhante a ChatGPT, DeepSeek ou Claude em termos de interface de usuário e está disponível gratuitamente em todo o mundo.

A nova funcionalidade é executada em três modelos de código aberto que trabalham em conjunto: Qwen3-Coder lida com a estrutura da web, Qwen-Image gera gráficos inline e Qwen3-TTS potencializa a narração de áudio dinâmica.

Apesar de depender de modelos de código aberto, a experiência ponta a ponta – incluindo execução de pesquisa, implantação na web e geração de áudio – é hospedada e operada pela Qwen como um serviço gerenciado.

O fluxo de trabalho começa dentro do Qwen Chat, onde os usuários colocam questões de pesquisa. A IA realiza pesquisas na web após alguns esclarecimentos, analisa dados de fontes públicas e gera um relatório abrangente com citações.

A partir daí, duas novas opções aparecem: “Web Dev” produz uma página da Web de nível profissional ao vivo, implantada e hospedada automaticamente pela Qwen, completa com gráficos embutidos.

Enquanto isso, o “Podcast” oferece uma discussão em áudio com narração dinâmica com vários alto-falantes, com 17 vozes de apresentador e sete opções de co-apresentador.

Testando os modelos

Para avaliar como o Qwen se destacou como ferramenta de pesquisa, executamos a mesma consulta de pesquisa complexa nele, Gemini, ChatGPT e Grok. A tarefa, que pode ser revisada em nosso repositório GitHub, foi analisar argumentos filosóficos e científicos a favor e contra a existência de Deus. Cada modelo gerou um relatório de pesquisa completo. A avaliação envolveu cinco critérios: precisão das afirmações e citações, informações fornecidas, clareza de explicação, riqueza intelectual e qualidade geral.

DR: Qwen Deep Research vence pela profundidade analítica, citação e suas páginas da web exclusivas geradas automaticamente, tornando-o ideal para acadêmicos e criadores. É também a melhor alternativa gratuita completa para pesquisadores. Mas Gemini ainda lidera em qualidade de áudio e vídeo, enquanto ChatGPT e Grok permanecem bons para uso casual, mas carecem do alcance de Qwen e do polimento do Google.

Aqui está uma análise mais aprofundada:

Precisão: As posições filosóficas e as afirmações científicas foram representadas corretamente, com a devida atribuição da fonte?

Qwen acertou em cheio nos detalhes. Ao discutir o argumento cosmológico, citou apropriadamente fontes acadêmicas como “Por que não sou cristão” de Bertrand Russell e o debate entre William Lane Craig e Peter Atkins, com referências específicas. Ao contrário de outros pesquisadores de IA como Perplexity ou Grok, a maioria das fontes são respeitáveis ​​e acadêmicas, às vezes até mesmo a Fonte Original. Incluía links de Stanford, Princeton, Oxford, Drew, mas adicionava análises pertinentes do Quora e do Facebook quando relevante.

Gemini combinou esta precisão com 94 citações numeradas, algumas das quais foram duplicadas quando referenciadas em diferentes partes do relatório.

Distinguiu corretamente entre conceitos. Ambos evitaram erros desleixados, como confundir o literalismo bíblico com o teísmo geral.

ChatGPT dependia muito da Enciclopédia de Filosofia de Stanford, mas às vezes simplificava demais. Grok forneceu resumos precisos, mas com atribuições mais vagas – dizendo coisas como “remontando a Platão, Aristóteles” sem obras específicas.

Resultado: Qwen e Gêmeos foram os melhores.

Informações fornecidas: Quão completa foi a pesquisa?

Qwen foi o único modelo a incluir uma seção chamada “Críticas ao Ateísmo: O Ônus da Prova e a Natureza da Evidência”. Esta seção examinou um tipo de debate que nenhum dos outros tocou. Distinguiu entre “ateísmo fraco” (ceticismo em relação às afirmações de Deus) e “ateísmo gnóstico” (afirmação positiva de que Deus não existe), e citou pensadores ateus específicos como o padrão “além de qualquer dúvida razoável” de Gary Whittenberger.

Aqui está um exemplo de passagem de Qwen: “Uma das questões mais controversas é o ônus da prova. Bertrand Russell ilustrou isso com sua analogia com o bule de chá: assim como ele não poderia provar que um pequeno bule de chá não orbita o Sol entre a Terra e Marte, ele argumentou que os teístas não poderiam provar que Deus existe.”

Nenhum outro modelo se aprofundou tanto nos debates sobre o ônus da prova porque provavelmente não era central para o tema. Gêmeos chegou perto com uma forte cobertura dos argumentos da consciência e da crítica do “Deus das lacunas”. ChatGPT incluiu argumentos pragmáticos como a aposta de Pascal e explorou implicações do mundo real para a ética e a política. Grok foi conciso – cerca de um terço do tamanho do relatório de Qwen – mas adicionou uma tabela de resumo útil.

Resultado: Qwen foi o mais exaustivo.

Clareza: Como a pesquisa foi expressa?

Grok usou uma tabela limpa para organizar os argumentos por tipo (Filosófico vs. Científico, A favor vs. Contra). Suas quebras de seção eram explícitas: “Argumentos Filosóficos”, “Argumentos Científicos”, “Detalhes Inesperados”. Qualquer um poderia digitalizá-lo rapidamente.

ChatGPT usou muitos esclarecimentos entre parênteses, tornando ideias complexas mais digeríveis. Exemplo: “se a existência de Deus for possível (isto é, logicamente coerente), então Deus existe necessariamente.” O “(ou seja, logicamente coerente)” ajuda os leitores que não são especialistas em filosofia.

Qwen e Gêmeos, por outro lado, eram mais acadêmicos em seu estilo. Qwen organizou o conteúdo sob títulos formais como “Argumentos Teístas para a Existência de Deus: Fundamentos Cosmológicos e Teleológicos”, o que fez com que toda a leitura parecesse muito densa, apesar de sua precisão. Gêmeos usou algarismos romanos (I. Introdução, II. Argumentos Filosóficos), que pareciam estruturados, mas exigiam uma leitura mais atenta.

Tanto Qwen quanto Gemini têm como alvo pesquisadores que realizam um trabalho sério. ChatGPT e Grok têm como alvo públicos mais amplos.

Resultado: ChatGPT apresentou as informações de forma mais clara, seguido por Grok.

Diversidade de fontes: A pesquisa baseia-se em tradições, disciplinas e perspectivas variadas?

Qwen integrou filosofia técnica (kalām, PSR, lógica modal S5) com debates científicos ao vivo (singularidades do Big Bang, flutuações quânticas, funcionalidade do DNA). Explicou as coisas, certificando-se de ser específico e dar exemplos básicos sobre posições e argumentos.

Por exemplo, ao explicar os argumentos teístas para a existência de Deus, Qwen construiu uma tabela para facilitar a compreensão das premissas, críticas e proponentes dos argumentos mais relevantes.

Gêmeos igualou isso ao cobrir argumentos de consciência que a maioria dos modelos ignorou. Também alertou contra o raciocínio do “Deus das lacunas” de forma mais explícita do que os concorrentes.

ChatGPT trouxe um valor único com sua enorme seção “Implicações”, explorando como o debate molda as políticas de educação científica, as leis de bioética e as atitudes pessoais em relação à morte. Isso foi menos acadêmico e mais pragmático, mas ainda relevante para compreender a natureza da investigação.

Grok abordou os principais argumentos, mas com menos detalhes. Mencionou o ajuste fino e o princípio antrópico, mas não citou valores específicos nem discutiu as coisas muito profundamente.

Resultado: Qwen e Gêmeos foram os melhores.

Qualidade: Considerando tudo isso – rigor, coerência, valor acadêmico – que pesquisa você gostaria de citar?

Tanto Qwen quanto Gemini produziram relatórios que você poderia enviar ao seu professor. A força única de Qwen era equilibrar a profundidade tanto nas linhas teístas quanto nas críticas ateístas, incluindo a seção do ônus da prova. A força de Gêmeos foi integrar as fronteiras científicas (consciência, evolução, cosmologia) com argumentos filosóficos.

ChatGPT proporcionou um valor pedagógico substancial – ótimo para ensinar ou compreender implicações. Grok funcionou como uma cartilha confiável ou referência rápida.

Em outras palavras, ChatGPT e Grok são provavelmente aqueles que você usaria se quisesse apenas saber algo rapidamente para uma conversa, para impressionar seu namorado nerd ou atualizar seu conhecimento antes de uma apresentação sobre algo que você já conhece.

Pontuações Finais:

  • Qwen: 9/10
  • Gêmeos: 9/10
  • Bate-papoGPT: 8/10
  • Grok: 6/10

A batalha do podcast: Qwen vs Gêmeos

O recurso de podcast de Qwen o coloca frente a frente com o NotebookLM e o Gemini do Google, pioneiros nas visões gerais de áudio geradas por IA.

Ao contrário do Gemini, o Qwen oferece uma grande variedade de vozes de apresentador para você escolher. A estrutura é sólida: dois hosts de IA têm uma conversa real sobre sua pesquisa, não apenas uma leitura de texto para fala.

Dito isto, a qualidade da voz é inconsistente. Algumas vozes são naturais, mas a maioria delas soa robótica com sotaques estranhos. Durante o teste, um dos apresentadores do sexo masculino repetia “oh oh oh” repetidamente, porque estava impressionado. Minha esposa passou e perguntou se eu estava assistindo pornografia.

Com algumas tentativas e erros, você pode encontrar uma voz decente que funcione perfeitamente e a qualidade aumente consideravelmente.

Mas Gemini e NotebookLM esmagam Qwen aqui. O recurso Audio Overviews do Google – introduzido no NotebookLM em setembro de 2024 e expandido para Gemini em março de 2025 – parece extremamente humano. Os padrões de fala são naturais, com brincadeiras e até humor.

Os podcasts do Gemini parecem humanos e mais envolventes.

Gêmeos também oferece geração de vídeo, o que é uma vantagem significativa para aqueles que preferem uma abordagem audiovisual para entender um tópico em vez de lendo longos pedaços de texto.

Qwen não pode fazer isso – na verdade, nenhum outro modelo pode.

Se você deseja multimídia completa, incluindo áudio, vídeo e web, o Gemini é o pacote mais completo.

A vantagem da página da web

Além da qualidade da pesquisa, o recurso matador do Qwen é a página da web gerada automaticamente. Nenhum outro modelo faz isso.

Depois que sua pesquisa terminar, você poderá transformá-la em um site hospedado e ativo. Não é um PDF ou um Documento Google – uma página da web real com cabeçalhos, tabelas formatadas, citações incorporadas como hiperlinks.

A IU se parece com Kimi; apresenta tipografia limpa, design responsivo e pode ser compartilhado instantaneamente.

Os usuários do ChatGPT precisam copiar e colar nos construtores de sites.

Gemini mantém tudo no Documentos. Grok cospe texto. Somente Qwen gera automaticamente resultados prontos para a web.

É bom ter essa vantagem do fluxo de trabalho.

Geralmente inteligente Boletim informativo

Uma jornada semanal de IA narrada por Gen, um modelo generativo de IA.



Fontedecrypt

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *