Tootfinder

Opt-in global Mastodon full text search. Join the index!

No exact results. Similar results found.
@arXiv_csLG_bot@mastoxiv.page
2025-07-14 08:19:51

Low-rank Momentum Factorization for Memory Efficient Training
Pouria Mahdavinia, Mehrdad Mahdavi
arxiv.org/abs/2507.08091 arxiv.org/pdf/2507.08091 arxiv.org/html/2507.08091
arXiv:2507.08091v1 Announce Type: new
Abstract: Fine-tuning large foundation models presents significant memory challenges due to stateful optimizers like AdamW, often requiring several times more GPU memory than inference. While memory-efficient methods like parameter-efficient fine-tuning (e.g., LoRA) and optimizer state compression exist, recent approaches like GaLore bridge these by using low-rank gradient projections and subspace moment accumulation. However, such methods may struggle with fixed subspaces or computationally costly offline resampling (e.g., requiring full-matrix SVDs). We propose Momentum Factorized SGD (MoFaSGD), which maintains a dynamically updated low-rank SVD representation of the first-order momentum, closely approximating its full-rank counterpart throughout training. This factorization enables a memory-efficient fine-tuning method that adaptively updates the optimization subspace at each iteration. Crucially, MoFaSGD leverages the computed low-rank momentum factors to perform efficient spectrally normalized updates, offering an alternative to subspace moment accumulation. We establish theoretical convergence guarantees for MoFaSGD, proving it achieves an optimal rate for non-convex stochastic optimization under standard assumptions. Empirically, we demonstrate MoFaSGD's effectiveness on large language model alignment benchmarks, achieving a competitive trade-off between memory reduction (comparable to LoRA) and performance compared to state-of-the-art low-rank optimization methods. Our implementation is available at github.com/pmahdavi/MoFaSGD.
toXiv_bot_toot

@kexpmusicbot@mastodonapp.uk
2025-06-14 13:14:34

🇺🇦 #NowPlaying on KEXP's #90TEEN
Freckle:
🎵 Taraval
#Freckle
freckledfreckles.bandcamp.com/
open.spotify.com/track/5m0fBSd

@MamasPinkyToe@mastodon.world
2025-08-13 13:05:14

"Rubbing one out" has different meanings to a mobster and his moll.

@mpsgoettingen@academiccloud.social
2025-07-11 10:56:26

The German radio station "Bayern 2" has devoted the latest episode of its show “IQ” to the #Sun - and to Solar Orbiter’s first views of the solar poles. Interview partner is Sami Solanki of #mpsgoettingen :

@dariaphoebe@mindly.social
2025-08-12 13:18:46

We had leftover home fries Sunday from brunch takeaway. Today they’re latkes, (with added oil egg and milk). Egg and bacon, tea and coffee. Our mahjongg buddy is busy but we will@probably play tonight anyway. #TogetherBreakfast photos.app.goo.gl/Mhw6iFA4k2Wd

@rmdes@mstdn.social
2025-07-11 14:18:10

How to use SDKMAN with MobaXterm on Win11: blog.rmendes.net/2025/07/11/ho

@radioeinsmusicbot@mastodonapp.uk
2025-08-14 12:24:10

🇺🇦 Auf radioeins läuft...
Peter and Kerry:
🎵 All I've Got Are My Dreams
#NowPlaying #PeterandKerry
peterandkerry.bandcamp.com/tra
open.spotify.com/track/3GvMPgH

@mpsgoettingen@academiccloud.social
2025-06-13 09:00:02

#ndwgoecountdown Ein Blick in den Himmel: Ausstellung Astrofotografie
Unser Nachthimmel ist voller atemberaubender Ansichten, die über die Astrofotografie sichtbar gemacht werden können, mit einer einfachen Kamera oder einem hochtechnischen Teleskop. Unsere Ausstellung zeigt Bilder von Sonne und Planeten über interstellare Gasnebel bis hin zu fernen Galaxien, aufgenommen von u…

Eine Aufnahme des Orionnebels: Fast die gesamte Bildfläche wird ausgefüllt durch vor allem pink, aber auch grau-bläulich und weiß, leuchtenden flächigen Gasansammlungen. Teilweise sind die Regionen am Rand scharf abgegrenzt und in der Fläche durch variable Dichte weiter strukturiert. Teile der leuchtenden Flächen sind von dunkleren, braun bis schwarz erscheinenden Striemen und Wolken durchzogen, die sich im Vordergrund befinden. Der Hintergrund ist dunkel und von Sternen mit unterschiedlichen H…
@mpsgoettingen@academiccloud.social
2025-06-14 09:00:04

#ndwgoecountdown Exoplaneten – Entdeckung von Planeten um ferne Sterne
Tausende Planeten, die um ferne Sterne kreisen, sind bisher bekannt. Doch wie entdeckt man einen Planeten, der viele Lichtjahre von uns entfernt ist? Im Mitmachexperiment erläutern Forscher*innen eine der gängigsten Methoden und berichten von der künftigen Weltraummission PLATO und ihrer Suche nach erdähnli…

Eine künstlerische Darstellung des PLATO-Raumfahrzeugs der ESA. Vor schwarzem Hintergrund fallen um den zentralen Teil der Mission herum rechts und links zuerst die silbern leuchtenden Flächen der Rückseiten von Solarpanelen auf. Im Zentrum dominieren viele kleine in einem 4x6 Raster angeordnete Teleskopöffnungen den Anblick, mit zwei weiteren kleinen Teleskopen, die oberhalb dieses regelmäßigen Rasters angebracht sind.
@radioeinsmusicbot@mastodonapp.uk
2025-06-13 06:46:03

🇺🇦 Auf radioeins läuft...
Peter and Kerry:
🎵 All I've Got Are My Dreams
#NowPlaying #PeterandKerry
peterandkerry.bandcamp.com/tra
open.spotify.com/track/3GvMPgH