"Redliche Normdaten in unserer Zeit"
https://wiki.dnb.de/spaces/GND/blog/2026/01/26/483428935/Redliche Normdaten in unserer Zeit
"Anfang des Jahres wurden die
Gemeinsam mit unserer #Fachgruppe werden wir in den kommenden Monaten herausfinden, wie wir unsere Arbeit in der Öffentlichkeit präsentieren können. Wir haben deshalb so lange Zettel hin und her geschoben und diskutiert, bis sich daraus ein grober Ablaufplan für unsere Abschlussveranstaltung ergab und unsere Köpfe rauchten.
SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards
Dengjia Zhang, Xiaoou Liu, Lu Cheng, Yaqing Wang, Kenton Murray, Hua Wei
https://arxiv.org/abs/2602.21158 https://arxiv.org/pdf/2602.21158 https://arxiv.org/html/2602.21158
arXiv:2602.21158v1 Announce Type: new
Abstract: Large language models (LLMs) are increasingly deployed as multi-step decision-making agents, where effective reward design is essential for guiding learning. Although recent work explores various forms of reward shaping and step-level credit assignment, a key signal remains largely overlooked: the intrinsic uncertainty of LLMs. Uncertainty reflects model confidence, reveals where exploration is needed, and offers valuable learning cues even in failed trajectories. We introduce SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards, a reinforcement learning framework that incorporates uncertainty directly into the reward design. SELAUR integrates entropy-, least-confidence-, and margin-based metrics into a combined token-level uncertainty estimate, providing dense confidence-aligned supervision, and employs a failure-aware reward reshaping mechanism that injects these uncertainty signals into step- and trajectory-level rewards to improve exploration efficiency and learning stability. Experiments on two benchmarks, ALFWorld and WebShop, show that our method consistently improves success rates over strong baselines. Ablation studies further demonstrate how uncertainty signals enhance exploration and robustness.
toXiv_bot_toot
Immer wieder die Frage: warum wurde Ungarn in die EU aufgenommen?
#ungarn
RE: https://mastodon.social/@UnicornRiot/115947315956725538
ice balls thrown at iceholes
Die bisher sehr von mir geschätzte NGO @… hat die Seite gewechselt und betätigt sich jetzt als #Datenkrake.
Dafür müssten sie eigentlich ihren Mastodon-Account bei
Der korrupte Autokrat Victor #Orban droht der #Ukraine damit, Gaslieferungen einzufrieren.
Das müsste man so beantworten, dass auch seitens angrenzender Länder und der EU Energielieferungen u.a. eingefroren werden.
Vielleicht lernt Orban es auf diese Weise, dass er hier nicht ungeschoren den Ganoven g…
How reality TV is running into the harsh realities of the fast-changing TV business; Luminate says US unscripted and reality premieres fell by ~33% since 2022 (John Koblin/New York Times)
https://www.nytimes.com/2026/03/24/business/media/reality-tv-era-ending.htm…
PROGRAMME IS LIVE NOW UncertainFM
https://uncertain.fm
Stefon Diggs faces uncertain future with Patriots: New England has decision to make with star WR
https://www.cbssports.com/nfl/news/stefon-diggs-faces-uncertain-fu…