small TRM

#2
by janisaiad - opened
MVA+IASD LLM for code and proof org

j'ai eu 95% avec un modèle bouclant/TRM à 25-40k params et j'pense que certaines formes de TRM sans reasoning (z) fonctionnent bien, il faudrait qu'on discute du training/compute

MVA+IASD LLM for code and proof org

Oh super intéressant !! Très curieux de voir ça :-)

Sign up or log in to comment