Tootfinder

Opt-in global Mastodon full text search. Join the index!

No exact results. Similar results found.
@heiseonline@social.heise.de
2025-09-25 13:25:00

Kryptowährung: Neun führende europäische Banken entwickeln Euro-Stablecoin
Neun europäische Banken, darunter DekaBank, entwickeln Euro-Stablecoin als Antwort auf US-Dominanz im digitalen Zahlungsverkehr.

@NFL@darktundra.xyz
2025-09-24 11:30:35

Kyler Murray has the 'ultimate confidence' in Trey Benson taking over for James Conner nfl.com/news/kyler-murray-has-

@arXiv_csLG_bot@mastoxiv.page
2025-09-25 10:50:32

When Judgment Becomes Noise: How Design Failures in LLM Judge Benchmarks Silently Undermine Validity
Benjamin Feuer, Chiung-Yi Tseng, Astitwa Sarthak Lathe, Oussama Elachqar, John P Dickerson
arxiv.org/abs/2509.20293

@kexpmusicbot@mastodonapp.uk
2025-09-25 14:00:19

🇺🇦 #NowPlaying on KEXP's #Early
Benjamin Gibbard:
🎵 Ichiro’s Theme
#BenjaminGibbard
benjamingibbard.bandcamp.com/t
open.spotify.com/track/34O8x4A

@maxheadroom@hub.uckermark.social
2025-08-25 19:44:25

TIL: ratarmount at binblog.de/2025/08/14/benchmar
Thanks @…

@Speckdaene@nrw.social
2025-09-25 12:05:22

#Armut anders bemessen
Arm ist nicht nur, wer wenig Geld hat. Um Armut besser bemessen zu können, haben Wissenschaftler*innen nun ein Bewertungssystem entwickelt, das viele Dimensionen der Armut mit einschließt.
#Energie

@arXiv_csAI_bot@mastoxiv.page
2025-09-24 09:30:04

The Illusion of Readiness: Stress Testing Large Frontier Models on Multimodal Medical Benchmarks
Yu Gu, Jingjing Fu, Xiaodong Liu, Jeya Maria Jose Valanarasu, Noel Codella, Reuben Tan, Qianchu Liu, Ying Jin, Sheng Zhang, Jinyu Wang, Rui Wang, Lei Song, Guanghui Qin, Naoto Usuyama, Cliff Wong, Cheng Hao, Hohin Lee, Praneeth Sanapathi, Sarah Hilado, Bian Jiang, Javier Alvarez-Valle, Mu Wei, Jianfeng Gao, Eric Horvitz, Matt Lungren, Hoifung Poon, Paul Vozila

@arXiv_csCV_bot@mastoxiv.page
2025-09-25 10:39:32

EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models
Botai Yuan, Yutian Zhou, Yingjie Wang, Fushuo Huo, Yongcheng Jing, Li Shen, Ying Wei, Zhiqi Shen, Ziwei Liu, Tianwei Zhang, Jie Yang, Dacheng Tao
arxiv.org/abs/2509.20146

@heiseonline@social.heise.de
2025-09-25 05:16:00

Verbraucher stellen Ansprüche an digitalen Euro
Wer bargeldlos bezahlt, will auch bei einem digitalen Euro keine Kompromisse machen. Warum Banken und Sparkassen das EZB-Projekt trotzdem mit Skepsis begleiten.

@arXiv_csAI_bot@mastoxiv.page
2025-09-25 08:06:52

What Does Your Benchmark Really Measure? A Framework for Robust Inference of AI Capabilities
Nathanael Jo, Ashia Wilson
arxiv.org/abs/2509.19590