Tootfinder

Opt-in global Mastodon full text search. Join the index!

@sascha_wolfer@fediscience.org
2026-01-25 17:30:46

Ich hab ein paar Weiterentwicklungsideen für @…, allen voran würde ich gerne am Ende jedes vollen Monats eine Art Übersicht posten, welche Wortformen besonders lang überlebt haben, um Okkasionalismen (die vermutlich die Mehrzahl der neu detektierten Wörter ausmachen) auszuschließen.
Lemmatisierung wäre natürlich auch fein, denn wenn man ehrlich ist, findet der Bot natürlich nicht nur neue Wörter, sondern neue Wortformen. Gerade bei diesen neuen Formen ist aber automatische #Lemmatisierung leider notorisch schwierig.
Für weitere Ideen bin ich immer dankbar.
#linguistik

@sascha_wolfer@fediscience.org
2026-01-25 10:18:07

Ich hab einen #Bot gebaut, der jeden Tag einmal 10 neue deutsche Wörter postet: @…
Der Bot durchsucht ein paar deutschsprachige RSS-Feeds, um neue Wörter zu entdecken.
'Neu' heißt in dem Fall, dass die Wörter nicht auf einer Liste von ca. 39 Millionen 'alten' Wörtern stehen und bisher noch nicht vom Bot selbst gefunden wurden.
Wenn Ihr Fragen habt, immer her damit.
#Linguistik

@tschfflr@fediscience.org
2026-01-07 07:30:37

📺 Zwischen den Jahren kam nochmal eine Sendung zu Emojis mit O-Ton von mir, diesmal "Die Ratgeber" im HR - noch zwei Jahre in der Mediathek:
#emojis #linguistik

@sascha_wolfer@fediscience.org
2026-01-22 14:58:36

Dinge, die man "vor sich hin" tun kann (geordnet nach Korpushäufigkeit, TOP 10):
- dümpeln
- plätschern
- dämmern
- murmeln
- gammeln
- rosten
- dösen
- starren
- wursteln / wurschteln
- vegetieren
Nur noch Freitag, dann könnt Ihr das ganze Wochenende vor Euch hin sinnieren oder trödeln.
(Quelle: Winkler (2016). Vor sich hindümpeln und vor sich herschieben — zwei produktive Muster im Deutschen? In: Juan Cuartero Otal, Juan Pablo Larreta Zulategui und Christoph Ehlers (Hg.) : Querschnitt durch die deutsche Sprache aus spanischer Sicht. Berlin: Frank & Timme, 2016.(Sprachwissenschaft - 30), S. 89-109.)
#linguistik

@sascha_wolfer@fediscience.org
2026-01-16 07:10:55

Allen *was* zum Trotz?
- Unkenrufen
- Widrigkeiten
- Widerständen
- Warnungen
- Beteuerungen
- Schwierigkeiten
- Gerüchten
- Bemühungen
- Dementis
- Protesten
(TOP 10 einer Korpusabfrage in KorAP des @…)
#linguistik

@tschfflr@fediscience.org
2026-01-30 08:13:33

🤔 Wie können Daten aus sozialen Medien gesammelt, archiviert und für die Forschung genutzt werden? Hilft der DSA? Darf ich meine Korpora weitergeben und wie mache ich das am besten? -- Themen der "Social Media Access Days" im März an der @…
Registrierung ist offen! Und ich bin auch dabei 🤗
#socialmedia #archivierung #korpora #tagung #linguistik #nfdi #forschungsdaten
dnb.de/EN/Professionell/Sammel