enzii
/

Qwen3-4B-Instruct-TLDR-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen3-4B-Instruct-TLDR-GRPO

8.06 GB

1 contributor

History: 5 commits

enzii's picture

Training completed on 2025-08-10 15:02:34

68c4c83 verified 4 months ago