## DeepSeek-V4 и Moonshot AI убили AdamW: почему оптимизатор Muon меняет физику обучения нейросетей

← Все статьи