张康宁's picture

1 12 5

张康宁

zhuiguang-ning

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 28 days ago

Your Group-Relative Advantage Is Biased

liked a dataset 29 days ago

zwhe99/DeepMath-103K

upvoted a paper about 1 month ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

None yet

Papers 2

arxiv:2403.03954

arxiv:2309.01940

models 2

zhuiguang-ning/LoopTool-32B

33B • Updated Dec 10, 2025 • 540 • 1

zhuiguang-ning/LoopTool-8B

8B • Updated Dec 10, 2025 • 692 • 1

datasets 1

zhuiguang-ning/LoopTool-23k

Viewer • Updated Dec 10, 2025 • 23k • 27 • 2