notch
NEWS↑ trending51

Introducing AutoMuon, a one line drop in for AdamW [P]

Reddit r/MachineLearning·26 de abril de 2026

Foi lançado o AutoMuon, um pacote Python que permite usar o otimizador Muon como substituto do AdamW em pipelines de treinamento PyTorch. Ele automatiza a escolha do otimizador correto para cada parâmetro, combinando Muon para matrizes de peso e AdamW para outros componentes do modelo.

deep learningoptimizerpython packagepytorch
Ler original