"Redliche Normdaten in unserer Zeit"
https://wiki.dnb.de/spaces/GND/blog/2026/01/26/483428935/Redliche Normdaten in unserer Zeit
"Anfang des Jahres wurden die
London-based digital bank Allica, which caters to over 30K SMBs across the UK, raised a $155M Series D from Ventura Capital and others at a $1.2B valuation (Tom Matsuda/Sifted)
https://sifted.eu/articles/allica-bank-unicorn-news/
Die @… spricht sich gegen den geplanten Android-Lockdown ein:
"Obwohl Google es als Sicherheitsmassnahme darstellt, handelt es sich tatsächlich um die Einführung einer verpflichtenden und zentralisierten Überprüfung der Identität sämtlicher App-Entwickler:innen durch Google. […]
Google hätte damit die Position, alleine zu entscheiden, welche Apps …
Maximilian Runge-Segelhorst über die Natur unseres Geldes und der #Gesellschaft
https://karl-voit.at/2025/12/26/Runge-Segelhorst-MMT/
Ich hab' mir dieser Tage eine int…
Kennt ihr schon unsere Solawi-Karte? Dort können Verbraucherinnen und Verbraucher Solawis in ihrer Nähe finden.
Wir teilen nicht nur unsere Ernte, sondern auch unsere Software! 4 #Solawi-Dachorganisationen haben sich heute zur Frage der Finanzierung der Karte getroffen. Geeinigt haben wir uns auf eine #Beitragsrunde
SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards
Dengjia Zhang, Xiaoou Liu, Lu Cheng, Yaqing Wang, Kenton Murray, Hua Wei
https://arxiv.org/abs/2602.21158 https://arxiv.org/pdf/2602.21158 https://arxiv.org/html/2602.21158
arXiv:2602.21158v1 Announce Type: new
Abstract: Large language models (LLMs) are increasingly deployed as multi-step decision-making agents, where effective reward design is essential for guiding learning. Although recent work explores various forms of reward shaping and step-level credit assignment, a key signal remains largely overlooked: the intrinsic uncertainty of LLMs. Uncertainty reflects model confidence, reveals where exploration is needed, and offers valuable learning cues even in failed trajectories. We introduce SELAUR: Self Evolving LLM Agent via Uncertainty-aware Rewards, a reinforcement learning framework that incorporates uncertainty directly into the reward design. SELAUR integrates entropy-, least-confidence-, and margin-based metrics into a combined token-level uncertainty estimate, providing dense confidence-aligned supervision, and employs a failure-aware reward reshaping mechanism that injects these uncertainty signals into step- and trajectory-level rewards to improve exploration efficiency and learning stability. Experiments on two benchmarks, ALFWorld and WebShop, show that our method consistently improves success rates over strong baselines. Ablation studies further demonstrate how uncertainty signals enhance exploration and robustness.
toXiv_bot_toot
Wrote a post about setting up the smb csi driver in your #homelab #kubernetes cluster and using talosctl to back up your #talos etcd to a NAS.
https://unixorn.github.io/post/homelab/k8s/04-backup-talos-etcd-to-smb/
@…
„Dass Grenzsicherung immer weiter jenseits unserer Grenzen stattfindet, wird nicht verhindern, dass der Totalitarismus in unsere Vorgärten Einzug hält.“ - Mike Davies, 2006 (!) https://www.zeit.de/2006/42/Mauern/komplettansicht
🌞 Eine Woche voller Sonne, Austausch und Ideen, wie wir unsere Arbeitswelt lebenswerter gestalten können.
Wir waren wir für unser Projekt #ViVid im wunderschönen Baskenland, in Basoa bei Bilbao. Das Thema:
LiVeability – wie gestalten wir unsere Arbeitsräume und Zusammenarbeit lebenswert?
Die Highlights der vergangenen Woche:
Tag 1: Workshop zu Safe Spaces & Entwicklung e…