MOCHA: Are Code Language Models Robust Against Multi-Turn Malicious Coding Prompts?
Muntasir Wahed, Xiaona Zhou, Kiet A. Nguyen, Tianjiao Yu, Nirav Diwan, Gang Wang, Dilek Hakkani-T\"ur, Ismini Lourentzou
https://arxiv.org/abs/2507.19598
SDD: Self-Degraded Defense against Malicious Fine-tuning
Zixuan Chen, Weikai Lu, Xin Lin, Ziqian Zeng
https://arxiv.org/abs/2507.21182 https://arxiv.org/pd…
"We simply don’t know to defend against these attacks. We have zero agentic AI systems that are secure against these attacks.[…] It’s an existential problem that, near as I can tell, most people developing these technologies are just pretending isn’t there."
https://www.
Este es un buen artículo de opinión para entender cómo la administración de Rodrigo Chaves Robles (alias zoodrigo, el presidente de Costa Rica acosador sexual que llegó al poder violando leyes de financiamiento de campañas políticas y parece gobernar para no estorbar al narco) ha hecho un daño enorme a instituciones públicas "desde adentro": poniendo a jerarcas "sumisos y servirles" en puestos de juntas directivas de instituciones autónomas para que tomen decisiones contr…
Very high-energy gamma-ray and neutrino emission from hadronic interaction in compact binary millisecond pulsars
Vittoria Vecchiotti, Manuel Linares
https://arxiv.org/abs/2508.20952
Mir wird DIE ZEIT ja schon seit längerem immer etwas fremder. Aber gut, man entwickelt sich und vielleicht verkläre ich die Zeitung "von früher" auch nur nostalgisch. Bisher war ich froh, dass es sie als Stimme gibt.
Aber bei einem der wichtigsten Themen überhaupt - der Zukunft unserer Demokratie - wirkt allein schon die Bildsprache inzwischen so plump und ungelenk wie vom TikTok Clickbait-Slop abgeschaut. Die Zeitung und der Diskurs brauchen solche Dämlichkeiten nicht.
📢 Waffenruhe zwischen Thailand und Kambodscha vereinbart
Thailand und Kambodscha haben sich auf eine sofortige Feuerpause geeinigt. Das teilte der malaysische Ministerpräsident Anwar Ibrahim nach Verhandlungen der beiden Länder nach den jüngsten Auseinandersetzungen mit.
➡️ https://www.
Guarding Against Malicious Biased Threats (GAMBiT) Experiments: Revealing Cognitive Bias in Human-Subjects Red-Team Cyber Range Operations
Brandon Beltz, Jim Doty, Yvonne Fonken, Nikolos Gurney, Brett Israelsen, Nathan Lau, Stacy Marsella, Rachelle Thomas, Stoney Trent, Peggy Wu, Ya-Ting Yang, Quanyan Zhu
https://arxiv.org/abs/2508.20963…
An energy approach to pulsar-disc interaction: disc stability and implications for transitional millisecond pulsars
Eda Vurgun, Domingo Garc\'ia-Senz, Manuel Linares, K. Yavuz Eksi
https://arxiv.org/abs/2505.23407
AgentAlign: Navigating Safety Alignment in the Shift from Informative to Agentic Large Language Models
Jinchuan Zhang, Lu Yin, Yan Zhou, Songlin Hu
https://arxiv.org/abs/2505.23020