YYYYYYibo
/

two_agent_2_dpo_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions

two_agent_2_dpo_iter_2

14.5 GB

1 contributor

History: 4 commits

YYYYYYibo's picture

DPO-7b-beta0.01

31ce256 verified over 1 year ago