Tootfinder

Opt-in global Mastodon full text search. Join the index!

No exact results. Similar results found.
@heiseonline@social.heise.de
2025-08-09 14:59:00

Vier Raumfahrer von der ISS abgedockt
Rund eine Woche nach der Ankunft ihrer Ablöse-Crew haben sich vier Raumfahrer von der ISS auf den Weg zurück zur Erde gemacht.
heise.de/news/Vier-Raumfah…

@Dragofix@veganism.social
2025-08-09 00:15:18

Oil exploration in the Congo basin rainforest could be a disaster for nature and the climate theguardian.com/environment/20

@macandi@social.heise.de
2025-06-10 05:03:00

Analyse zur WWDC 2025-Keynote: Apple will (wieder) gut aussehen
Apple renoviert das Aussehen seiner Betriebssysteme und umgarnt die Entwickler. Aber wie stark sitzt dem iPhone-Hersteller das KI-Thema im Nacken? Eine Analyse.

@arXiv_csLG_bot@mastoxiv.page
2025-06-09 10:11:02

Reinforcement Learning Optimization for Large-Scale Learning: An Efficient and User-Friendly Scaling Library
Weixun Wang, Shaopan Xiong, Gengru Chen, Wei Gao, Sheng Guo, Yancheng He, Ju Huang, Jiaheng Liu, Zhendong Li, Xiaoyang Li, Zichen Liu, Haizhou Zhao, Dakai An, Lunxi Cao, Qiyang Cao, Wanxi Deng, Feilei Du, Yiliang Gu, Jiahe Li, Xiang Li, Mingjie Liu, Yijia Luo, Zihe Liu, Yadao Wang, Pei Wang, Tianyuan Wu, Yanan Wu, Yuheng Zhao, Shuaibing Zhao, Jin Yang, Siran Yang, Yingshui Tan, …

@arXiv_csCV_bot@mastoxiv.page
2025-07-10 08:54:01

Video-RTS: Rethinking Reinforcement Learning and Test-Time Scaling for Efficient and Enhanced Video Reasoning
Ziyang Wang, Jaehong Yoon, Shoubin Yu, Md Mohaiminul Islam, Gedas Bertasius, Mohit Bansal
arxiv.org/abs/2507.06485

@arXiv_quantph_bot@mastoxiv.page
2025-06-10 11:41:52

Deep reinforcement learning for near-deterministic preparation of cubic- and quartic-phase gates in photonic quantum computing
Amanuel Anteneh L\'eandre Brunel, Carlos Gonz\'alez-Arciniegas, Olivier Pfister
arxiv.org/abs/2506.07859

@arXiv_csRO_bot@mastoxiv.page
2025-06-09 08:21:22

Improving Long-Range Navigation with Spatially-Enhanced Recurrent Memory via End-to-End Reinforcement Learning
Fan Yang, Per Frivik, David Hoeller, Chen Wang, Cesar Cadena, Marco Hutter
arxiv.org/abs/2506.05997

@arXiv_qfinTR_bot@mastoxiv.page
2025-07-10 08:57:11

Reinforcement Learning for Trade Execution with Market Impact
Patrick Cheridito, Moritz Weiss
arxiv.org/abs/2507.06345

@heiseonline@social.heise.de
2025-08-09 11:00:00

Die Stimme von "Houston, we´ve had a problem" ist verstummt
Mit 97 Jahren ist NASA-Astronaut Jim Lovell gestorben. Seine Raumfahrt-Karriere ist eine Geschichte des Scheiterns und Weitermachens – und von viel Glück.

@arXiv_csLG_bot@mastoxiv.page
2025-07-09 10:13:42

Detecting and Mitigating Reward Hacking in Reinforcement Learning Systems: A Comprehensive Empirical Study
Ibne Farabi Shihab, Sanjeda Akter, Anuj Sharma
arxiv.org/abs/2507.05619