Tootfinder

Opt-in global Mastodon full text search. Join the index!

No exact results. Similar results found.
@v_i_o_l_a@openbiblio.social
2026-02-25 14:31:18

"Redliche Normdaten in unserer Zeit"
wiki.dnb.de/spaces/GND/blog/20
"Anfang des Jahres wurden die

@rakewi@systemli.social
2026-02-24 11:40:37

Gemeinsam mit unserer #Fachgruppe werden wir in den kommenden Monaten herausfinden, wie wir unsere Arbeit in der Öffentlichkeit präsentieren können. Wir haben deshalb so lange Zettel hin und her geschoben und diskutiert, bis sich daraus ein grober Ablaufplan für unsere Abschlussveranstaltung ergab und unsere Köpfe rauchten.

Zwei Personen sortieren Zettel an einem Tisch, auf denen Wörter wie Luna zeigen, Diashow, Dankesworte, Rätsel oder lockeres Zusammensein stehen.
Ein Fachgruppen-Mitglied spricht in einem Seminarraum. Zwei Personen hören zu.
Fünf Personen stehen in einem Seminarraum um einen Tisch und begutachten Zettel, die in zwei langen Reihen vor ihnen liegen.
@arXiv_csLG_bot@mastoxiv.page
2026-02-25 10:43:51

SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards
Dengjia Zhang, Xiaoou Liu, Lu Cheng, Yaqing Wang, Kenton Murray, Hua Wei
arxiv.org/abs/2602.21158 arxiv.org/pdf/2602.21158 arxiv.org/html/2602.21158
arXiv:2602.21158v1 Announce Type: new
Abstract: Large language models (LLMs) are increasingly deployed as multi-step decision-making agents, where effective reward design is essential for guiding learning. Although recent work explores various forms of reward shaping and step-level credit assignment, a key signal remains largely overlooked: the intrinsic uncertainty of LLMs. Uncertainty reflects model confidence, reveals where exploration is needed, and offers valuable learning cues even in failed trajectories. We introduce SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards, a reinforcement learning framework that incorporates uncertainty directly into the reward design. SELAUR integrates entropy-, least-confidence-, and margin-based metrics into a combined token-level uncertainty estimate, providing dense confidence-aligned supervision, and employs a failure-aware reward reshaping mechanism that injects these uncertainty signals into step- and trajectory-level rewards to improve exploration efficiency and learning stability. Experiments on two benchmarks, ALFWorld and WebShop, show that our method consistently improves success rates over strong baselines. Ablation studies further demonstrate how uncertainty signals enhance exploration and robustness.
toXiv_bot_toot

@waidler@bayerwald.social
2026-02-24 06:27:23

Immer wieder die Frage: warum wurde Ungarn in die EU aufgenommen?
#ungarn

@andres4ny@social.ridetrans.it
2026-01-24 00:59:52

RE: mastodon.social/@UnicornRiot/1
ice balls thrown at iceholes

@chpietsch@fedifreu.de
2026-03-22 11:23:51

Die bisher sehr von mir geschätzte NGO @… hat die Seite gewechselt und betätigt sich jetzt als #Datenkrake.
Dafür müssten sie eigentlich ihren Mastodon-Account bei

E-Mail von Lobbycontrol:

„damit Sie unseren Newsletter weiterhin erhalten können, benötigen wir Ihre Bestätigung.

Wir möchten Sie auch künftig über Lobbyismus in Deutschland und der EU informieren und unsere Recherchen mit Ihnen teilen. Damit wir noch besser werden und unsere Arbeit stärker an den Interessen unserer Leserinnen und Leser ausrichten können, entwickeln wir unseren Newsletter weiter.

Dafür speichern und werten wir künftig aus, wer unsere E-Mails zu welchem Zeitpunkt öffnet und w…
@annsev@troet.cafe
2026-03-25 14:14:47

Der korrupte Autokrat Victor #Orban droht der #Ukraine damit, Gaslieferungen einzufrieren.
Das müsste man so beantworten, dass auch seitens angrenzender Länder und der EU Energielieferungen u.a. eingefroren werden.
Vielleicht lernt Orban es auf diese Weise, dass er hier nicht ungeschoren den Ganoven g…

@Mediagazer@mstdn.social
2026-03-24 15:15:43

How reality TV is running into the harsh realities of the fast-changing TV business; Luminate says US unscripted and reality premieres fell by ~33% since 2022 (John Koblin/New York Times)
nytimes.com/2026/03/24/busines

@grahams@mastodon.social
2026-03-24 00:00:31

PROGRAMME IS LIVE NOW UncertainFM
uncertain.fm

Green grass field with trees under blue sky

Orange text overlaid promoting a radio show, details in the main post.
@NFL@darktundra.xyz
2026-02-23 18:26:32

Stefon Diggs faces uncertain future with Patriots: New England has decision to make with star WR

cbssports.com/nfl/news/stefon-