tttx
/

p10-ttt-021125-scratch-final-run-continue-step4

alignment-handbook

Generated from Trainer

Model card Files Files and versions

aadityap commited on Feb 12, 2025

Commit

5c726e3

·

verified ·

1 Parent(s): 435960b

End of training

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -3,10 +3,13 @@ library_name: peft
 license: mit
 base_model: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
 tags:
 - trl
 - sft
-- alignment-handbook
 - generated_from_trainer
 model-index:
 - name: p10-ttt-021125-scratch-final-run-continue-step4
   results: []
@@ -17,7 +20,7 @@ should probably proofread and complete it, then remove this comment. -->
 # p10-ttt-021125-scratch-final-run-continue-step4
-This model is a fine-tuned version of [deepseek-ai/DeepSeek-R1-Distill-Qwen-32B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B) on the None dataset.
 ## Model description

 license: mit
 base_model: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
 tags:
+- alignment-handbook
 - trl
 - sft
 - generated_from_trainer
+datasets:
+- tttx/p10-ttt-021125-scratch-final-run-continue-step4-childw
+- tttx/p10-ttt-021125-scratch-final-run-continue-step4-master
 model-index:
 - name: p10-ttt-021125-scratch-final-run-continue-step4
   results: []
 # p10-ttt-021125-scratch-final-run-continue-step4
+This model is a fine-tuned version of [tttx/p10-ttt-021125-scratch-final-run-step1](https://huggingface.co/tttx/p10-ttt-021125-scratch-final-run-step1) on the tttx/p10-ttt-021125-scratch-final-run-continue-step4-childw and the tttx/p10-ttt-021125-scratch-final-run-continue-step4-master datasets.
 ## Model description