improve gradient accumulation (#300)

2025-11-25 14:37:24 +00:00 · 2024-08-05 18:27:20 -05:00 · 2024-08-05 18:27:20 -05:00 · 192bdc3501
commit 192bdc3501
parent 089901db26
1 changed files with 2 additions and 1 deletions
--- a/ch06/02_bonus_additional-experiments/additional-experiments.py
+++ b/ch06/02_bonus_additional-experiments/additional-experiments.py
@ -259,7 +259,8 @@ def train_classifier_simple(model, train_loader, val_loader, optimizer, device,
            loss.backward()  # Calculate loss gradients
            # Use gradient accumulation if accumulation_steps > 1
-            if batch_idx % accumulation_steps == 0:
+            is_update_step = ((batch_idx + 1) % accumulation_steps == 0) or ((batch_idx + 1) == len(train_loader))
            if is_update_step:
                optimizer.step()  # Update model weights using loss gradients
                optimizer.zero_grad()  # Reset loss gradients from previous batch iteration