enzii
/

Qwen3-4B-Instruct-TLDR-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen3-4B-Instruct-TLDR-GRPO / training_args.bin

Commit History

Training completed on 2025-08-10 15:02:34

68c4c83
verified

enzii commited on Aug 10, 2025

Training completed on 2025-08-10 04:56:35

307a434
verified

enzii commited on Aug 10, 2025

Training completed on 2025-08-10 04:43:13

0fa6111
verified

enzii commited on Aug 10, 2025

Model save

30d5a5b
verified

enzii commited on Aug 10, 2025