hckrnws

9 months ago

Sat May 3, 2025 7:59pm PST

Reinforcement Learning for Reasoning in LLMs with One Training Example

@delduca

read article

comments:

add comment

loading comments...