Alibaba Abandona Modo Híbrido de Pensamento em Seus Modelos Qwen 3: Uma Nova Estratégia para Melhor Performance

Imagem principal da notícia: Alibaba Abandona Modo Híbrido de Pensamento em Seus Modelos Qwen 3: Uma Nova Estratégia para Melhor Performance

Em uma reviravolta estratégica, a Alibaba decidiu abandonar o polêmico modo híbrido de pensamento em seus modelos Qwen 3. A empresa reconheceu que esta funcionalidade,虽然便利,但牺牲了质量和性能。A postagem recente da equipe Qwen explica:

'Depois de conversar com a comunidade e refletir, decidimos parar de usar o modo híbrido de pensamento. Em vez disso, treinaremos os modelos Instruct e Thinking separadamente para alcançar a melhor qualidade possível.'

Melhorias significativas: Com este ajuste, os modelos Instruct mostraram melhoras notáveis, especialmente no benchmark matemático AIME25. Por exemplo, o modelo Qwen3-235B-A22B-Instruct-2507 registrou uma melhoria de 2.8x em relação à versão de abril.

Curiosamente, os modelos Thinking também melhoraram, mas não tão drasticamente. No entanto, a equipe da Alibaba continua pesquisando para reintroduzir o modo híbrido no futuro, uma vez que resolva questões de qualidade.

Aumento da janela de contexto: Além disso, os modelos agora têm uma janela de contexto maior (de 32k tokens para 256k), o que é crucial para tarefas de pensamento mais longas. A Alibaba recomenda definir pelo menos 128k tokens para melhor aproveitamento.

Enquanto a empresa foca em separar as funcionalidades, os desenvolvedores teasaram versões otimizadas para código e planos de lançar atualizações nos próximos dias.

Fernanda Almeida

Fernanda Almeida

É interessante ver como a Alibaba aprendeu com suas decisões iniciais. Às vezes, é preciso voltar ao básico para alcançar a excelência. Felizmente, o progresso continua!

Ver mais postagens do autor →
← Post anterior Próximo post →