BWT for string collections
Davide Cenzato, Zsuzsanna Lipt\'ak, Nadia Pisanti, Giovanna Rosone, Marinella Sciortino
https://arxiv.org/abs/2506.01092 htt…
Leider werden viele Leute keinen Widerspruch bei Meta eingelegt haben gegen die KI-Verwendung ihrer Facebook/Instagram-Daten, weil sie dachten "Boah, schon wieder so ein nutzloser Ich-widerspreche Post der nicht funktioniert."
Bin da wohl nicht ganz unschuldig dran, hab vor 11 Jahren einen Scherz gepostet, den viele nicht erkannten (siehe ab Zeile 10)
#Meta
Don't Unwrap Options: There Are Better Ways #Rust
https://corrode.dev/blog/rust-option-handling-best-practices/
Bridging Offline and Online Reinforcement Learning for LLMs
Jack Lanchantin, Angelica Chen, Janice Lan, Xian Li, Swarnadeep Saha, Tianlu Wang, Jing Xu, Ping Yu, Weizhe Yuan, Jason E Weston, Sainbayar Sukhbaatar, Ilia Kulikov
https://arxiv.org/abs/2506.21495 https://arxiv.org/pdf/2506.21495 https://arxiv.org/html/2506.21495
arXiv:2506.21495v1 Announce Type: new
Abstract: We investigate the effectiveness of reinforcement learning methods for finetuning large language models when transitioning from offline to semi-online to fully online regimes for both verifiable and non-verifiable tasks. Our experiments cover training on verifiable math as well as non-verifiable instruction following with a set of benchmark evaluations for both. Across these settings, we extensively compare online and semi-online Direct Preference Optimization and Group Reward Policy Optimization objectives, and surprisingly find similar performance and convergence between these variants, which all strongly outperform offline methods. We provide a detailed analysis of the training dynamics and hyperparameter selection strategies to achieve optimal results. Finally, we show that multi-tasking with verifiable and non-verifiable rewards jointly yields improved performance across both task types.
toXiv_bot_toot
TIL (im IC5): man holt sich Schminktipps nicht mehr in der italienischen Vogue, sondern auf TikTok! Dito Ausflugvorschläge für Sommerbeizli.
Neben mir sitzen Grosi (ca. 75) und Enkelin (ca. 25), sehr süss zusammen
Nächstes Thema: Verwandte und Freunde im Filmgeschäft und überhaupt. Anschliessend: wo welche Beiz war, zum gemütlich feiern, aber mit ordentlichen Stühlen! Next: Taxigeld ausgleichen (Grosi an Enkelin, eh klar)
Und ich vermisse grad meine Oma sehr
HighRateMOS: Sampling-Rate Aware Modeling for Speech Quality Assessment
Wenze Ren, Yi-Cheng Lin, Wen-Chin Huang, Ryandhimas E. Zezario, Szu-Wei Fu, Sung-Feng Huang, Erica Cooper, Haibin Wu, Hung-Yu Wei, Hsin-Min Wang, Hung-yi Lee, Yu Tsao
https://arxiv.org/abs/2506.21951