"Redliche Normdaten in unserer Zeit"
https://wiki.dnb.de/spaces/GND/blog/2026/01/26/483428935/Redliche Normdaten in unserer Zeit
"Anfang des Jahres wurden die
Stefon Diggs faces uncertain future with Patriots: New England has decision to make with star WR
https://www.cbssports.com/nfl/news/stefon-diggs-faces-uncertain-fu…
Gemeinsam mit unserer #Fachgruppe werden wir in den kommenden Monaten herausfinden, wie wir unsere Arbeit in der Öffentlichkeit präsentieren können. Wir haben deshalb so lange Zettel hin und her geschoben und diskutiert, bis sich daraus ein grober Ablaufplan für unsere Abschlussveranstaltung ergab und unsere Köpfe rauchten.
Jadeveon Clowney's Future With Dallas Cowboys Remains Uncertain https://www.si.com/nfl/cowboys/onsi/news/jadeveon-clowney-future-dallas-cowboys-remains-uncertain
SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards
Dengjia Zhang, Xiaoou Liu, Lu Cheng, Yaqing Wang, Kenton Murray, Hua Wei
https://arxiv.org/abs/2602.21158 https://arxiv.org/pdf/2602.21158 https://arxiv.org/html/2602.21158
arXiv:2602.21158v1 Announce Type: new
Abstract: Large language models (LLMs) are increasingly deployed as multi-step decision-making agents, where effective reward design is essential for guiding learning. Although recent work explores various forms of reward shaping and step-level credit assignment, a key signal remains largely overlooked: the intrinsic uncertainty of LLMs. Uncertainty reflects model confidence, reveals where exploration is needed, and offers valuable learning cues even in failed trajectories. We introduce SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards, a reinforcement learning framework that incorporates uncertainty directly into the reward design. SELAUR integrates entropy-, least-confidence-, and margin-based metrics into a combined token-level uncertainty estimate, providing dense confidence-aligned supervision, and employs a failure-aware reward reshaping mechanism that injects these uncertainty signals into step- and trajectory-level rewards to improve exploration efficiency and learning stability. Experiments on two benchmarks, ALFWorld and WebShop, show that our method consistently improves success rates over strong baselines. Ablation studies further demonstrate how uncertainty signals enhance exploration and robustness.
toXiv_bot_toot
Immer wieder die Frage: warum wurde Ungarn in die EU aufgenommen?
#ungarn
«Unser Unternehmen ist 150 Jahre alt. Es ist jetzt das erste Mal in der Geschichte, dass wir unseren Treibstoff selbst herstellen können.»
https://www.srf.ch/news/wirtschaft/elektrifizierung-erstmals-koennen-wir-unseren-treibstoff…
TNBT sagt Tschüss: Auf Wiedersehen, Vision Pro | TNBT-Podcast
Die Zukunft, die nicht kommen wollte: In unserer letzten Folge ziehen wir ein Zwischenfazit zu Apples Mammutprojekt Vision Pro.
https://www.
RE: https://mastodon.social/@UnicornRiot/115947315956725538
ice balls thrown at iceholes
Die bisher sehr von mir geschätzte NGO @… hat die Seite gewechselt und betätigt sich jetzt als #Datenkrake.
Dafür müssten sie eigentlich ihren Mastodon-Account bei