Lidl: So lief das Döner-Croissant-Event mit Muca Kebap https://www.horizont.net/marketing/nachrichten/apple-moment-am-doenerimbiss-lidl-so-lief-das-doener-croissant-event-mit-muca-kebap-233909
Sabrina Mittermeier beklagt den unkritischen Umgang mit generativer »KI« in der Wissenschaft und spricht mir damit aus dem Herzen.
Zum Beispiel bieten Hochschulbibliotheken Schulungen zur Literaturrecherche mit »Künstlicher Intelligenz« an, obwohl noch gar nicht geklärt sei, ob dabei Plagiate entstehen. (Oder nicht existierende Werke zitiert werden, würde ich hinzufügen.)
Ihr Abstract:
Die Anwendung sog. „Künstlicher Intelligenz“ hat massive rassistische, sexist…
POL-HI: E-Scooter-Fahrer unter Betäubungsmitteleinfluss gestoppt Hildesheim (ots) - BOCKENEM (lud) Am 09.02.2026, gegen 12:30 Uhr, kontrollierten Beamte der Polizei Bad Salzdetfurth im Schlangenweg in 31167 Bockenem im Rahmen einer Verkehrskontrolle einen 46-jährigen E-Scooter-Fahrer. Hierbei wurde anlässlich ... https://www.
POL-DH: --- Sulingen, Betrug durch falsche Polizeibeamte --- Diepholz (ots) - Am Donnerstag, den 26.02.2026 gab sich ein unbekannter Täter gegenüber einem 69-jährigen Sulinger telefonisch als falscher Polizeibeamter aus und behauptete, dass eine Bekannte des Angerufenen in einen Verkehrsunfall verwickelt ... https://www.…
Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design
Bin Zhu, Qianghuai Jia, Tian Lan, Junyang Ren, Feng Gu, Feihu Jiang, Longyue Wang, Zhao Xu, Weihua Luo
https://arxiv.org/abs/2603.28376 https://arxiv.org/pdf/2603.28376 https://arxiv.org/html/2603.28376
arXiv:2603.28376v1 Announce Type: new
Abstract: Deep research agents autonomously conduct open-ended investigations, integrating complex information retrieval with multi-step reasoning across diverse sources to solve real-world problems. To sustain this capability on long-horizon tasks, reliable verification is critical during both training and inference. A major bottleneck in existing paradigms stems from the lack of explicit verification mechanisms in QA data synthesis, trajectory construction, and test-time scaling. Errors introduced at each stage propagate downstream and degrade the overall agent performance. To address this, we present Marco DeepResearch, a deep research agent optimized with a verification-centric framework design at three levels: \textbf{(1)~QA Data Synthesis:} We introduce verification mechanisms to graph-based and agent-based QA synthesis to control question difficulty while ensuring answers are unique and correct; \textbf{(2)~Trajectory Construction:} We design a verification-driven trajectory synthesis method that injects explicit verification patterns into training trajectories; and \textbf{(3)~Test-time scaling:} We use Marco DeepResearch itself as a verifier at inference time and effectively improve performance on challenging questions. Extensive experimental results demonstrate that our proposed Marco DeepResearch agent significantly outperforms 8B-scale deep research agents on most challenging benchmarks, such as BrowseComp and BrowseComp-ZH. Crucially, under a maximum budget of 600 tool calls, Marco DeepResearch even surpasses or approaches several 30B-scale agents, like Tongyi DeepResearch-30B.
toXiv_bot_toot
Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs
Yining Hong, Huang Huang, Manling Li, Li Fei-Fei, Jiajun Wu, Yejin Choi
https://arxiv.org/abs/2602.21198 https://arxiv.org/pdf/2602.21198 https://arxiv.org/html/2602.21198
arXiv:2602.21198v1 Announce Type: new
Abstract: Embodied LLMs endow robots with high-level task reasoning, but they cannot reflect on what went wrong or why, turning deployment into a sequence of independent trials where mistakes repeat rather than accumulate into experience. Drawing upon human reflective practitioners, we introduce Reflective Test-Time Planning, which integrates two modes of reflection: \textit{reflection-in-action}, where the agent uses test-time scaling to generate and score multiple candidate actions using internal reflections before execution; and \textit{reflection-on-action}, which uses test-time training to update both its internal reflection model and its action policy based on external reflections after execution. We also include retrospective reflection, allowing the agent to re-evaluate earlier decisions and perform model updates with hindsight for proper long-horizon credit assignment. Experiments on our newly-designed Long-Horizon Household benchmark and MuJoCo Cupboard Fitting benchmark show significant gains over baseline models, with ablative studies validating the complementary roles of reflection-in-action and reflection-on-action. Qualitative analyses, including real-robot trials, highlight behavioral correction through reflection.
toXiv_bot_toot
Plonger dans une librairie, c’est bien plus qu’un simple acte d’achat ou de curiosité. C’est entrer dans un univers où les pages deviennent des fenêtres ouvertes sur des horizons infinis. Que vous soyez un amoureux de la lecture Š la recherche d’une nouvelle pépite, un adepte du cairn tsundoku...
🔗 Voir les librairies https://
🌈 Cadolzburg für Vielfalt und Demokratie am Samstag, 24. Januar 2026 vor dem Rathaus um 11 bis 13 Uhr.🎉
:BoostOK: Wiederholung am Samstag, 31. Januar.
✊💜 Eine Menschenkette soll ein Zeichen für #Vielfalt und #Demokratie setzen!
POL-NOM: Illegale Entsorgung von Tierkadavar Uslar (ots) - Uslar, (go), OT Kammerborn, Sollingstraße, (Ecke Buchenbergstraße), Freitag, der 27.02.2026, 13:00 Uhr. Bislang unbekannte Personen entsorgten illegal Tierkadavar auf einem Grundstück eines 32- jährigen aus einem Uslarer Ortsteil. ... https://www.presseportal.de/…
POL-NOM: Diebstahl von Zaunelementen Uslar (ots) - Uslar, (go), OT Sohlingen, (Feldweg/Am Strothberg), zwischen Samstag, dem 14.02.2026, 17:00 Uhr und Sonntag, dem 15.02.2026, 10:03 Uhr. Bislang unbekannte Täter entwendeten 3 Zaunelemente eines 66- jährigen aus Trendelburg und ... https://www.presseportal.de/blaulicht/pm…