Em uma reviravolta estratégica, a Alibaba decidiu abandonar o polêmico modo híbrido de pensamento em seus modelos Qwen 3. A empresa reconheceu que esta funcionalidade,虽然便利,但牺牲了质量和性能。A postagem recente da equipe Qwen explica:
'Depois de conversar com a comunidade e refletir, decidimos parar de usar o modo híbrido de pensamento. Em vez disso, treinaremos os modelos Instruct e Thinking separadamente para alcançar a melhor qualidade possível.'
Melhorias significativas: Com este ajuste, os modelos Instruct mostraram melhoras notáveis, especialmente no benchmark matemático AIME25. Por exemplo, o modelo Qwen3-235B-A22B-Instruct-2507 registrou uma melhoria de 2.8x em relação à versão de abril.
Curiosamente, os modelos Thinking também melhoraram, mas não tão drasticamente. No entanto, a equipe da Alibaba continua pesquisando para reintroduzir o modo híbrido no futuro, uma vez que resolva questões de qualidade.
Aumento da janela de contexto: Além disso, os modelos agora têm uma janela de contexto maior (de 32k tokens para 256k), o que é crucial para tarefas de pensamento mais longas. A Alibaba recomenda definir pelo menos 128k tokens para melhor aproveitamento.
Enquanto a empresa foca em separar as funcionalidades, os desenvolvedores teasaram versões otimizadas para código e planos de lançar atualizações nos próximos dias.