CLARity: Reasoning Consistency Alone Can Teach Reinforced Experts
Jiuheng Lin, Cong Jiang, Zirui Wu, Jiarui Sun, Yansong Feng
https://arxiv.org/abs/2510.09278 https://
SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning
Haozhan Li, Yuxin Zuo, Jiale Yu, Yuhao Zhang, Zhaohui Yang, Kaiyan Zhang, Xuekai Zhu, Yuchen Zhang, Tianxing Chen, Ganqu Cui, Dehui Wang, Dingxiang Luo, Yuchen Fan, Youbang Sun, Jia Zeng, Jiangmiao Pang, Shanghang Zhang, Yu Wang, Yao Mu, Bowen Zhou, Ning Ding
https://arxiv.org/a…
Retrocedamos solo un año, hasta 1983, cuando R.E.M. publicaba su primer larga duración (antes habían publicado el EP Chronic Town). ¡Cómo no la iban a romper en los círculos universitarios y underground con este discazo que aún sigue sonando fresco y original!
Murmur
#REM #NowPlaying
Knapp 30 Jahre davor hatte ich als damaliger Umweltreferent des u-asta auch schon Aktionen zum gleichen Thema. Eine der langsam mahlenden Mühlen in #freiburg
https://www.
Reinforcing Diffusion Models by Direct Group Preference Optimization
Yihong Luo, Tianyang Hu, Jing Tang
https://arxiv.org/abs/2510.08425 https://arxiv.org/…
Elterntaxis - Lasst sie laufen!
https://www.sueddeutsche.de/bayern/elterntaxis-bayern-nuernberg-schulen-kampagne-li.3335344
Can SSD-Mamba2 Unlock Reinforcement Learning for End-to-End Motion Control?
Gavin Tao, Yinuo Wang, Jinzhao Zhou
https://arxiv.org/abs/2509.07593 https://ar…
In-Context Policy Adaptation via Cross-Domain Skill Diffusion
Minjong Yoo, Woo Kyung Kim, Honguk Woo
https://arxiv.org/abs/2509.04535 https://arxiv.org/pdf…