trl-lib
/

Qwen2-0.5B-DPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

1.99 GB

1 contributor

History: 11 commits

qgallouedec's picture

qgallouedec HF Staff

End of training

6c744a6 verified about 1 year ago