Ugh, lost some training runs because files got saved to the wrong place

2026-01-06 04:12:30 +00:00 · 2025-07-09 17:57:34 +00:00 · 2025-07-09 17:57:34 +00:00 · ca8e503870
commit ca8e503870
parent 02f0706edc
4 changed files with 12 additions and 12 deletions
--- a/olmocr/train/configs/qwen25_vl_b100_x1_day3_json.yaml
+++ b/olmocr/train/configs/qwen25_vl_b100_x1_day3_json.yaml
@ -2,7 +2,7 @@

 # Project metadata
 project_name: olmocr-qwen-vl-training
-run_name: qwen2.5-vl-7b-finetune-day2-json
+run_name: qwen2.5-vl-7b-finetune-day3-json

 # Model configuration
 model:
@ -58,7 +58,7 @@ dataset:

 # Training configuration
 training:
-  output_dir: /home/ubuntu/olmocr-trainer/
+  output_dir: /weka/oe-data-default/jakep/olmocr-trainer/
  num_train_epochs: 1
  
  # Batch size and accumulation
@ -72,7 +72,7 @@ training:
  
  # Learning rate
  learning_rate: 2e-5
-  lr_scheduler_type: cosine
+  lr_scheduler_type: linear
  warmup_ratio: 0.1
  
  # Optimization
--- a/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_1280.yaml
+++ b/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_1280.yaml
@ -2,7 +2,7 @@

 # Project metadata
 project_name: olmocr-qwen-vl-training
-run_name: qwen2.5-vl-7b-finetune-day2-1280
+run_name: qwen2.5-vl-7b-finetune-day3-1280

 # Model configuration
 model:
@ -58,7 +58,7 @@ dataset:

 # Training configuration
 training:
-  output_dir: /home/ubuntu/olmocr-trainer/
+  output_dir: /weka/oe-data-default/jakep/olmocr-trainer/
  num_train_epochs: 1
  
  # Batch size and accumulation
@ -72,7 +72,7 @@ training:
  
  # Learning rate
  learning_rate: 2e-5
-  lr_scheduler_type: cosine
+  lr_scheduler_type: linear
  warmup_ratio: 0.1
  
  # Optimization
--- a/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_1280_noanchor.yaml
+++ b/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_1280_noanchor.yaml
@ -2,7 +2,7 @@

 # Project metadata
 project_name: olmocr-qwen-vl-training
-run_name: qwen2.5-vl-7b-finetune-day2-1280-noanchor
+run_name: qwen2.5-vl-7b-finetune-day3-1280-noanchor

 # Model configuration
 model:
@ -58,7 +58,7 @@ dataset:

 # Training configuration
 training:
-  output_dir: /home/ubuntu/olmocr-trainer/
+  output_dir: /weka/oe-data-default/jakep/olmocr-trainer/
  num_train_epochs: 1
  
  # Batch size and accumulation
@ -72,7 +72,7 @@ training:
  
  # Learning rate
  learning_rate: 2e-5
-  lr_scheduler_type: cosine
+  lr_scheduler_type: linear
  warmup_ratio: 0.1
  
  # Optimization
--- a/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_1600.yaml
+++ b/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_1600.yaml
@ -2,7 +2,7 @@

 # Project metadata
 project_name: olmocr-qwen-vl-training
-run_name: qwen2.5-vl-7b-finetune-day2-1600
+run_name: qwen2.5-vl-7b-finetune-day3-1600

 # Model configuration
 model:
@ -58,7 +58,7 @@ dataset:

 # Training configuration
 training:
-  output_dir: /home/ubuntu/olmocr-trainer/
+  output_dir: /weka/oe-data-default/jakep/olmocr-trainer/
  num_train_epochs: 1
  
  # Batch size and accumulation
@ -72,7 +72,7 @@ training:
  
  # Learning rate
  learning_rate: 2e-5
-  lr_scheduler_type: cosine
+  lr_scheduler_type: linear
  warmup_ratio: 0.1
  
  # Optimization