Chakraborty's picture

1

Chakraborty

souradip24

·

https://souradip-chakraborty.github.io/

AI & ML interests

Reinforcement Learning, Machine Learning, NLP

Recent Activity

updated a model 2 days ago

souradip24/dpo-llama-3.2-3b-set1-pref100

published a model 2 days ago

souradip24/dpo-llama-3.2-3b-set1-pref100

upvoted a paper 19 days ago

Agentic Critical Training

View all activity

Organizations

Papers 10

arxiv:2504.01931

arxiv:2503.12575

arxiv:2501.03486

arxiv:2411.18688

models 1

souradip24/dpo-llama-3.2-3b-set1-pref100

3B • Updated 2 days ago • 147

datasets 0

None public yet